# Beiträge zur deutschen Grammatik

## Gesammelte Schriften von Tilman N. Höhle

*Zweite durchgesehene Auflage*

Herausgegeben von

Stefan Müller Marga Reis Frank Richter

Classics in Linguistics 5

### Classics in Linguistics

Chief Editors: Martin Haspelmath, Stefan Müller

In this series:


# Beiträge zur deutschen Grammatik

## Gesammelte Schriften von Tilman N. Höhle

*Zweite durchgesehene Auflage*

Herausgegeben von

Stefan Müller Marga Reis Frank Richter

Stefan Müller, Marga Reis & Frank Richter (Hrsg.): *Beiträge zur deutschen Grammatik: Gesammelte Schriften von Tilman N. Höhle. Zweite durchgesehene Auflage*. (Classics in Linguistics 5). Berlin: Language Science Press.

This title can be downloaded at: http://langsci-press.org/catalog/book/234 © 2019 Chapters 1, 4, 9, 14–17 Tilman Höhle; Chapter 2 Bouvier Verlag Grundmann; Chapter 3 Stauffenburg Verlag; Chapters 5–7, 11, 13 Walter de Gruyter GmbH; Chapters 8, 10 Springer Science+Business Media S.A.; Chapter 12 John Benjamins Publishing Company; Chapter 18 CSLI Publications. Published under the Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 Licence (CC-BY-NC-ND 4.0); Chapters 1–4, 9, 12, 14–18 additionally published under the Creative Commons Attribution 4.0 Licence (CC-BY 4.0). https://creativecommons.org/licenses/by-nc-nd/4.0; https://creativecommons.org/licenses/by/4.0. ISBN: 978-3-96110-149-8 (Digital) 978-3-96110-150-4 (Hardcover) ISSN: 2366-374X DOI:10.5281/zenodo.2588383

Source code available from www.github.com/langsci/234 Collaborative reading: paperhive.org/documents/remote?type=langsci&id=234 Cover and concept of design: Ulrike Harbort Typesetting: Luise Dorenbusch, Luise Hiller, Robert Fritzsche, Sebastian Nordhoff, Stefan Müller

Fonts: Linux Libertine, Arimo, DejaVu Sans Mono Typesetting software: XƎLATEX

Language Science Press Unter den Linden 6 10099 Berlin, Germany langsci-press.org

Storage and cataloguing done by FU Berlin

## **Contents**


### Contents


## **Preface**

### **About this volume: introductory remarks**

The idea for this volume was born in 2014 when Stefan Müller reread Tilman N. Höhle's work on *Topologische Felder* from 1983, and thought it a shame that this fundamental work on German clause structure was still unpublished. Talking over his plan to change this with Marga Reis and Frank Richter, who were to become the co-editors of this volume, drew the attention to further important but unpublished Höhle papers from the eighties and nineties that likewise deserved publication. This spawned the plan for a bigger volume comprising these papers as well. But it did not take long to see that, ideally, this volume should also include most of Höhle's already published work: There are exceedingly close connections between his unpublished and published papers as to topics, content, theoretical outlook and aims that an attentive reader would want to trace and should be able to trace easily. This led to the conception of the present volume, which, certain difficulties notwithstanding (see Postscript, pp. xviii ff.), we pursued steadfastly and finally brought to completion this year.

Before turning to the contents of this volume let us briefly turn to its author and to our motives for (re)publishing his work.

Tilman N. Höhle, born 1945, studied General Linguistics, Indo-European Linguistics, and German Philology at the University of Göttingen and the University of Cologne, where he received his M.A. (1969) and his PhD (1976). Having taught at the German Seminar of the University of Cologne for a couple of years, he changed to the University of Tübingen in 1984 where, besides teaching German linguistics, he was involved in training several generations of general and computational linguists in grammatical theory as well as theoretically oriented descriptive German grammar. A complete list of his publications is contained in the list of references, pp. xv ff. He retired in 2008.

Like many German linguists starting their studies in the sixties and seventies Höhle embraced Generative Grammar as the most promising way of doing linguistics, and he remained committed throughout his career to its central theoretical and methodological goals (which later on he found better realized in

### Preface

Head-Driven Phrase Structure Grammar (HPSG) than in generative linguistics following the Minimalist Program). Without striving for academic prominence he soon became one of the most respected figures, a true grey eminence, in the German generative scene. His written work covers a wide range of syntactic topics, in particular topological and related aspects of clause structure (topological fields and topological clause types, non-finite constructions, coordination, extraction, constituent order, focus projection, verum focus), but also aspects of word syntax, the lexicon, and phonological phenomena, as well as broader issues such as lexicalist syntax, reconstruction, theoretical aspects of phonology, in particular in model-theoretic grammar (HPSG). All of it was highly influential in shaping a theoretically and empirically well-founded grammar of German but also contributed significantly to grammatical theory, in general and in its HPSG variant.

Linguistics is a fast-moving discipline, so the eighties and nineties of the last century are already history. Still, Höhle's work – and this is the main motive for the present volume – is not just historically important we believe, but also worth knowing for contemporary linguists, especially those interested in the grammar of German within the Germanic context. The clearest case in point is *Topologische Felder*, so far unpublished and rather inaccessible, whose wealth of descriptive and theoretical insights still remains to be fully appreciated. But even in the cases in which Höhle papers, published or not, initiated a lively international debate and are still frequently cited (think, e.g., of his papers on asymmetric coordination (1983a; 1990) or verum focus (1988; 1992)), (re)reading the originals leads to observations and ideas worth pursuing that have not found their way into contemporary literature.

Let us now turn to the contents of the present volume. In order to make the project manageable, we did not include all of Höhle's papers but concentrated on the – to our mind central – contributions to grammar in the narrower sense of (morpho-)syntax and grammatical theory. Thus, we set aside the early phonological papers (Höhle & Vater 1978; Höhle 1982b), likewise papers that are, in various ways, pre-versions to later, often more comprehensive studies on the same topic; this led to the exclusion of Höhle (1979; 1982c; 1988; 1996b) in favor of Höhle (1982a; 1985; 1992; 2000) respectively, which are all included here. With these provisos, the present volume is a complete collection of Höhle's work on German grammar and grammatical theory (apart, of course, from his dissertation, published as Höhle (1978)).

The volume is organized in two parts. Part I consists exclusively of **Topologische Felder** (Topological fields) (= Chapter 1 in this volume) a book-length work written in 1983, which remained unfinished but circulated as a 'grey paper' in

the generative community. It is a fundamental study of German clause structure in that it establishes in detail the topological properties of German sentences and how they constitute the basic clause types of German. The study also pays detailed attention to the left-peripheral topological extensions of clause types, which includes a thorough discussion of 'left dislocation' phenomena and pertinent remarks on coordination. This descriptive enterprise is a) embedded in a critical comparison with Greenberg's word order typology, which is shown to be unable to capture the essentials of German clause structure; b) supplemented by explanatory endeavors turning on astute arguments of learnability; c) enriched by a historical excursus showing that the correct topological picture of German clauses (although sometimes coupled with false beliefs in 'subject inversion') had already been achieved in the 19th century (hence Höhle also calls it the 'Herling/Erdmann system'); even the idea that the true verb position is clause-final can already be found in Herling's writings. These insights were soon forgotten; it was not before the sixties/seventies of the last century that (more or less independently of this tradition) they came to life again.

*Topologische Felder* is foundational for most of the papers assembled in part II, which justifies its exclusive position in this volume.

Part II ('Selected papers') collects the remaining 17 papers, which are as a rule presented in chronological order; however, the 5 papers with a distinctly HPSG orientation are grouped together at the end. Our short presentations of their contents follow this order.

**Empirische Generalisierung vs. ,Einfachheit'. Zur Zuordnung zwischen formalen und logischen Eigenschaften von Sätzen im Deutschen** (Empirical generalization vs. 'simplicity'. On the mapping between formal and logical properties of sentences in German, 1980) (= Chapter 2 in this volume). In this short paper Höhle argues forcefully against mistaking the form of logical representations of sentences for their syntactic structure, thereby also demonstrating that the autonomy of syntax manifests itself most clearly in topological regularities – wherefore "this part of grammar seems to merit the utmost theoretical interest" (p. 105). It is clear that this conviction drives Höhle's linguistic research in the following decades.

**Explikationen für** " **normale Betonung**" **und** " **normale Wortstellung**" (Explications of "normal stress" and "normal word order", 1982) (= Chapter 3 in this volume). Unlike the verbal placement patterns involved in forming topological clause types, the ordering patterns for nonverbal constituents are variable in German. Nonetheless, there was always the intuition that for every constituent constellation there are (more or less) 'normal' orders, but, as Höhle makes abundantly clear, a satisfactory explication of this intuition is nowhere given. His

### Preface

own explication makes crucial use of the notions 'focus' and 'focus projection', and proceeds in the two stages indicated by the title of this paper: (i) A sentence S*<sup>i</sup>* has 'stylistically normal stress contour' iff it has more possible foci than any other stress contour variant of S*<sup>i</sup>* . (ii) A sentence S*<sup>i</sup>* has 'stylistically normal word order' iff, given an appropriate stress contour, it has more possible foci than any other ordering or stress contour variant of S*<sup>i</sup>* . The reference to 'possible foci' ensures that these explications belong to sentence grammar, yet implies, at the same time, that both are inherently pragmatic concepts, for having more possible foci than the respective variants means being able to occur in more context types. This also affords a rather natural *explanation* for the intuition of normalcy.

This long paper is hard reading but rewarding, in addition to the above, not only for the many observations and generalizations deduced from the above explications but also for its critical discussion of a structural explication of 'normal word order', which still does not seem outdated.

**Subjektlücken in Koordinationen** (Subject gaps in coordinations, 1983) (= Chapter 4 in this volume). This paper is the first study of so-called SLF-coordinations like (1), with 'SLF' indicating their salient formal properties: a) there is a subject gap ('Subjektlücke' = *SL*) in the second conjunct, b) both conjuncts are clauses with fronted verb ('*F*-clauses'), with the second conjunct obligatorily being an F1-clause. Crucially, despite *SL*, both conjuncts are inter pretively related to the overt subject of the first conjunct in the same way.

(1) Hoffentlich hopefully sieht sees uns us keiner nobody und and meldet reports uns us bei at der the Polizei. police 'Hopefully, nobody sees us and reports us to the police.'

The paper starts with a sketch of 'symmetric', i.e., 'phrasal coordination' where, roughly speaking, the substitutability criterion holds (every conjunct can substitute for the entire coordination salva grammaticalitate). Against this backdrop, the differing properties of SLF-coordinations are discussed in detail, in particular their most notable 'asymmetric' property, which is that the lack of subject in the second conjunct cannot result from ellipsis (hence the second conjuncts violates the substitutability criterion), and its interpretive counterpart, the 'fused' reading that all SLF-coordinations share. This paper, together with Höhle (1990) (see below), spurred a still active debate on asymmetric coordination in various Germanic languages.

**On composition and derivation: The constituent structure of secondary words in German** (1985) (= Chapter 5 in this volume). This study pursues a strictly lexicalist theory of word formation where all morphemes have a lexical entry with the usual (i.a. categorial) specifications. Its most salient claim is

that in such a framework the difference between composition and derivation can be entirely reduced to selectional properties of the respective morphemes: bound morphemes ('affixes') select other morphemes/morpheme classes to which they are thereby bound, free morphemes do not. This claim is carefully substantiated by presenting, first, the similarities of affixes to words, then by showing that compounds and derivations behave in a parallel fashion not only with respect to inflection but, on closer inspection, also with respect to boundary-related phenomena (such as the occurrence of linking morphemes, elision, stem formation) and even argument inheritance. Likewise, the detailed examination of formation processes underlying synthetic 'compounds' ('Zusammenbildungen'), the verbal complex, 'suffixless derivations' like *Stoß* 'push', *Unterschied* 'difference', and nominal infinitives does not yield any counterevidence either but many new insights into these difficult word-syntactic areas, and, last but not least, an ingenious argument in favor of the strictly lexicalist approach.

This paper is still the most comprehensive word-syntactic treatment of German word formation to date.

**Der Begriff 'Mittelfeld'. Anmerkungen über die Theorie der topologischen Felder** (The term 'middle field'. Remarks on the theory of topological fields, 1986) (= Chapter 6 in this volume). This paper is a compact version of the descriptive and historical sections of *Topologische Felder*, to which helpful diagrams and examples have been added, likewise extensive clarifying notes (concerning, e.g., the topological treatment of coherent structures). It also contains a brief history of topological 'field' terminology and in the final section, important argumentation in favor of a notion "S-Feld" comprising the middle field together with VK, which is shown to be descriptively necessary whereas the traditional notion of a separate 'middle field' is not. This paper has influenced practically all sections on the topology of German clauses in German syntax textbooks.

**Assumptions about asymmetric coordination in German** (1990) (= Chapter 7 in this volume). This study is again about asymmetric coordination, extending the coverage to instances where a) the first conjunct is verb-final, and b) the second conjunct may be a V2-clause, the most typical cases being *wenn*-clauses like (2a,b). Because of the subject gap in the second conjunct, which again is irreducible to ellipsis and obligatorily bound up with F1-form, Höhle classifies cases like (2b) as SLF-coordinations (see above); cases like (2a) are dubbed (asymmetric) F2-coordinations.

	- b. Wenn if jemand someone heimkommt home.comes und and sieht sees den the Gerichtsvollzieher bailiff …

### Preface

Since the introductory *wenn* has scope over the entire coordination, what is conjoined are unlike phrases: a V projection with a functional clausal projection (for Höhle an I projection). The entire paper is devoted to making the categories involved more precise and to derive the possible coordinations of this type, as well as their differences to symmetric coordinations, in a principled manner. While distinguishing between their first and asymmetric second conjunct as head vs. non-head, Höhle does not call into doubt that these constructions *are* coordinations, a position not always shared in later literature where adjunction analyses are argued for as well.

**On reconstruction and coordination** (1991) (= Chapter 8 in this volume). This paper is primarily concerned with scope and binding phenomena where dislocated elements D*<sup>i</sup>* appear 'reconstructed' into the position of their trace. Höhle considers two approaches to 'reconstruction': (i) D*<sup>i</sup>* is reconstructed into its original position on a level ('R-structure') different from S-structure, and the relevant scope and binding relations are computed there ('true reconstruction'), (ii) the definitions of these relations are extended in such a way that they yield the correct results on S-structure, i.e., they treat D*<sup>i</sup>* as if it were in the position of its trace ('pseudo-reconstruction'). Coordination comes in when comparing these approaches: while empirically equivalent in simple cases, Höhle observes that pseudo-reconstruction is in conflict with standard assumptions on how coordinate structures are to be translated into a semantic representation. Hence, either (i) is correct, or the translation theory for coordination needs revision. In settling this issue, Höhle provides first a concise outline of the fundamentals of coordination theory (including strong arguments against "forward conjunction reduction") and of German clause structure, based on which a comprehensive picture of scope and binding properties of dislocated phrases in German is given, prominently among them, of course, the reconstruction cases. These are then evaluated with respect to the two approaches in question. Höhle concludes, based on cases such as verum focus, lexical anaphors, and in particular parasitic gap phenomena, that true reconstruction cannot be correct, hence that the translation theory for coordination must be revised in accordance with what pseudo-reconstruction requires.

**Projektionsstufen bei V-Projektionen. Bemerkungen zu Frey/Tappe 1991** (Projection levels with V-projections. Remarks on Frey/Tappe 1991, 1991) (= Chapter 9 in this volume). Despite its origin as a commentary to a paper not reprinted here, this short paper is self-contained. It comments astutely on a number of important issues concerning the structure of the German VP, notably in verb-final clauses, and the nature of the V-projections in the various positions allowing for

them: the clause-final position, the fronted position (FIN), the pre-field. In particular, there is a forceful plea against identifying the verb in final position (V*<sup>e</sup>* ) with the V<sup>0</sup> we meet in the FIN position, to which we owe the famous argument from verbs like *uraufführen* ('stage the first performance'), *bausparen* ('save for building'), etc., which was already alluded to in Höhle (1978: 34) but is clearly spelled out here for the first time.

**Über Verum-Fokus im Deutschen** (On verum focus in German, 1992) (= Chapter 10 in this volume). The phenomenon called 'verum focus' since Höhle (1988) is illustrated in (3): focus on the fronted verb may have the effect of stressing the truth of the proposition expressed:

(3) Karl Karl HAT has bezahlt. paid [meaning: es it ist is *wahr*, true dass that Karl Karl bezahlt paid hat] has 'Karl DID pay.'

This suggests that what is stressed is an abstract meaning element VERUM that has the proposition in its scope. The present paper is a comprehensive discussion of its nature and location. First, it explores the idea (already proposed in Höhle (1982a) that VERUM is an 'illocution type [= IT] operator' (more exactly a variable over such operators). Despite some evidence in its favor, Höhle argues that it is untenable: a) main clause *wh*-interrogatives, e.g., have verum focus only on the fronted verb but the IT operator is (also) associated with the *wh*-phrase; b) subordinate clauses, which are incompatible with truly illocutionary operators, allow verum focus (in verb-final clauses located on C-elements like *dass* 'that', *ob* 'whether'); c) negation may have scope over VERUM, which is unheard of for true IT operators. So, at best, VERUM is a sort of truth predicate. Finding a segmental location for it is likewise difficult, given the controversial onset structure of German clauses and further bewildering data from verum focus in embedded *wh*- and relative clauses. In the end, Höhle suggests a non-segmental localization of VERUM, at the cost of strict compositionality.

**Vorangestellte Verben und Komplementierer sind eine natürliche Klasse** (Fronted verbs and complementizers are a natural class, 1997) (= Chapter 11 in this volume). This paper argues a) that fronted verbs preceding their subject are categorially different from those following their subject, b) that complementizers are sensitive to the same difference in relative placement, so that, in this respect, fronted verbs and complementizers form a natural class. On first glance, either claim seems bizarre but Höhle presents much evidence in their favor: (a) is supported by data from the West Frisian imperativus pro infinitivo phenomenon, as well as the many instances of special inverted verb forms in Old English, Dutch,

### Preface

Middle Low German, Old and Middle High German. Support for (b) are the distribution of *som* in Scandinavian relative and interrogative clauses (analogously *that* in English relatives), data from German relative clauses to non-3rd person, and from inflected complementizers in Dutch dialects that take up the inflection of the inverted form where possible. A schematized analysis is supplied for the relevant structures, which implies, importantly, that a subject in the pre-field of a V2-clause does not bind an Ā-trace. The paper concludes with a description of related facts in Bantu languages, which strongly suggests that the observations and results presented here are of rather general importance.

**The** *w***- …** *w***-construction: Appositive or scope indicating?** (2000) (= Chapter 12 in this volume). This paper is concerned with the analysis of constructions like (4):

	- 1) 'What do you think with respect to the question who he will fire?'
	- 2) 'Who do you think that he will fire?'

They became a hot topic in the eighties when the traditional idea that the *wh*clause was some sort of apposition to the *was* 'what' in the main clause (cf. translation 1), was challenged by the idea that this *was* marked the scope of the embedded *wh*-phrase (cf. translation 2), thus suggesting a 'direct dependency' approach. Höhle was the first to present a thorough comparative investigation of these analyses for German, which is documented in a series of influential handouts from 1989/1990, on which (together with an update in 1996) the present paper is based. After working out the salient characteristics of the *was* … *w*-construction and presenting the two competing analyses, Höhle discusses various important empirical phenomena and theoretical issues (*wh*-copy construction, *wh* in-situ, questions of LF-movement and interpretive dependency, exclamative versions of the construction), asking how the two analyses fare with respect to them. As a result, Höhle favors the direct dependency approach but in the course of the discussion, he also makes the 'appositive' approach more precise, thus anticipating the 'indirect dependency approach' that has become a serious rival of the direct dependency approach in the following years.

**Observing non-finite verbs: Some 3V phenomena in German-Dutch** (2006) (= Chapter 13 in this volume). This paper is an impressive survey over the systems of non-finite verb forms and the regularities governing them in numerous German and Dutch dialects, covering many dialect areas in fine-grained detail. It is shown by authentic material taken from pertinent sources that the differences

to the Standard German and Dutch systems may be enormous: instead of just three, there might be six non-finite forms (e.g., bare infinitive, *ge*-infinitive, bare gerund, *ge-* and *be*-gerund, participle)), in the extreme case even eight; substitutions, e.g., of the participle, may involve different forms (e.g., simple and complex supines instead of infinitives) as well as different substitution conditions; there are considerably different displacement phenomena, likewise order variation and ordering rules within the verbal complex not found in the Standard systems. Thus, the paper certainly reaches its professed aim formulated at the outset, which is to provide a more reliable research basis for the non-finite system than the rather poor systems of Standard German and Dutch have to offer, especially when claims of a more principled nature are at stake.

Turning now to the papers on Head-Driven Phrase Structure Grammar, they were all written in the 1990ies, starting toward the end of the protracted publication phase of the canonical presentation of HPSG in the book by Pollard and Sag. They are concerned with properties and the organization of the lexicon with special emphasis on syntactic traces (*Spuren in HPSG, Spurenlose Extraktion, Complement extraction lexical rule and variable argument raising*), with shared properties of relative pronouns, fronted verbs and complementizers in English, Norwegian, Swedish, Dutch and German (*Featuring creatures of darkness*), and with general problems of phonological theory and the relationship between the abstract structures characterized by phonotactic rules and observable empirical phenomena (*An architecture for phonology*).

The first group of papers pursues fundamental questions about lexical elements. Although the papers remained unpublished, they became highly influential in some circles of the HPSG community, drawing attention to the grammararchitectural dependencies in HPSG between postulating traces, different ways of interpreting lexical rule mechanisms, various options of expressing lexical generalizations, and the syntax of verb clusters and their dependents in German and English.

The series begins with **Spuren in HPSG** (Traces in HPSG) (= Chapter 14 in this volume), considerations about the nature of traces in HPSG that highlight important differences to assumptions concerning traces in other frameworks. In particular, *Spuren in HPSG* shows that traces do not enter into a linear order relation with other words in an utterance (an observation with major impact on language processing arguments involving the presumed position of traces which is often overlooked even today), and it points out intricate implications of the treatment of traces for the syntax of verbal projections in coherent constructions in German.

**Spurenlose Extraktion** (Traceless extraction) (= Chapter 15 in this volume) embarks on a thorough analysis of the consequences of eliminating traces from the theory of extraction by postulating extraction lexical rules. Different possibilities of implementing lexical rules are explored in great detail by painstakingly examining concrete lexical entries and corresponding entries that are derived by lexical rule. The problems that this discussion reveals with HPSG's early informal characterizations of lexical rules lead to a review of various alternatives, which are again explained with great precision. Many of the insights gained here became influential in later technical treatments of lexical rules and the lexicon in HPSG.

**Complement extraction lexical rule and variable argument raising** (= Chapter 16 in this volume) builds directly on results of *Spurenlose Extraktion* with a precise demonstration that a lexical rule (in the original framework-internal understanding of the mechanism) for complement extraction cannot be combined with standard HPSG assumptions concerning argument raising in the verbal complex without leading to massive problems. Again, the argument is presented with an extraordinary sense for detail, with exact specifications of the lexical entries that are involved in the analysis.

**Featuring creatures of darkness** (= Chapter 17 in this volume) turns to another empty lexical element of Pollard and Sag's book, the empty relativizer which their analysis of English relative clauses employs. Practitioners of HPSG traditionally dislike any kind of empty elements in grammar, which meant that the empty relativizer was immediately met with great skepticism. Höhle shows that, far from being obscure, the inner structure of Pollard and Sag's empty relativizer is surprisingly well-suited for a typological analysis of various elements at the left periphery of Germanic languages, including Norwegian, Swedish, Dutch and German. Under this perspective the empty relativizer serves as a blueprint for *wh*-interrogatives, complementizers, relative pronouns and fronted verbs alike, and the analysis provides valuable insight into a very difficult area of Germanic syntax. In many ways *Featuring creatures of darkness* is the more technically oriented HPSG twin of *Vorangestellte Verben und Komplementierer sind eine natürliche Klasse* (= Chapter 11) published three years later, and they should be read together.

**An architecture for phonology** (= Chapter 18 in this volume) applies the grammar architecture and logical apparatus of HPSG to phonology and morphophonology. It argues that model-theoretic grammar provides a solid foundation for reasoning about complicated empirical facts in this domain. In addition to outlining a sort hierarchy for phonology and fundamental principles, examples from German and Russian demonstrate the analytical usefulness of the approach. They give rise to interesting considerations of the complex relationship between

### References

the structures in the denotation of logical grammar theories and the objects of empirical observation, spelled out with more care here than anywhere else in the literature.

### **Acknowledgments**

Some of the papers (re)published in this book were available in electronic format. Some in Word and some even in LATEX. Others had to be digitized and re-typeset. This involved a lot of work. We are grateful to our typesetter Luise Dorenbusch, who did the initial conversion of the majority of the papers. Stefan Müller's student assistants Luise Hiller and Robert Fritzsche did the remaining chapters and the many cycles of revisions and adaptions. In the final period they were supported by Nico Lehmann. Sebastian Nordhoff helped with the semiautomatic creation of the index, checked the final manuscript and provided general technical support. A big "Thank you" to them all; without their dedication and care we would never have been able to produce such a sound publication.

Most of all, however, we would like to thank Tilman Höhle, who generously gave us permission to pursue our ever-expanding plans for publishing his linguistic writings in whatever form we decided on. Although his intellectual interests have moved away from linguistics, we hope that the present volume gives him some satisfaction.

Berlin, Tübingen, Bensheim, March 22, 2018

Stefan Müller, Marga Reis, Frank Richter

### **References**


### Preface


### References

(Studies in Natural Language and Linguistic Theory 22), 139–197. Dordrecht: Kluwer. [Chapter 8 in this volume, pp. 311–368].


### Preface

*day* (Studia Grammatica 63), 55–77. Berlin: Akademie-Verlag. [Chapter 13 in this volume, pp. 461–490].

Höhle, Tilman N. & Heinz Vater. 1978. *Derivational Constraints* und die silbischen Konsonanten im Deutschen. In Henrik Birnbaum, Lubomír Ďurovič, Gunnar Jacobsson, Nils-Åke Nilsson, Anders Sjöberg & Dean S. Worth (eds.), *Studia Linguistica Alexandro Vasilii filio Issatschenko a Collegis Amicisque oblata*, 169– 186. Lisse: Peter de Ridder.

### **Postscript: Rights & Permissions**

Preparing this book was a lot of work but the three of us took it in stride since we knew it was work done to make great papers of a colleague available for the first time and his published papers more accessible. However, one aspect of this process deserves special mention: the attempt to get the rights to republish Tilman Höhle's work. This part of the work was extremely time consuming, extremely inefficient and extremely annoying. I want to explain why in a little more detail. Tilman Höhle published several very influential papers in the 80ies and 90ies. He published with Akademie-Verlag, Benjamins, Bouvier Grundmann, CSLI Publications, Foris, Kluwer, Niemeyer, Stauffenburg, and Westdeutscher Verlag. With the exception of Benjamins, Bouvier Grundmann, CSLI Publications and Stauffenburg all these publishers were bought by De Gruyter or Springer. An overview of this is presented in Table 1.


Table 1: Concentration in the publishing sector

The contracts that we signed in the 80ies and 90ies all included a passage say-

### References

ing that authors have the right to use their articles in collections of their own work or in books authored or coauthored by them. So we expected that it would not be a problem to get the permissions to put together a collection of Tilman Höhle's most important papers. I wrote emails to the remaining publishers and got fast positive responses by CSLI Publications and by Brigitte Narr from Stauffenburg. I called Benjamins, who were a bit delayed due to the holiday season, but reacted quickly after my call. We got permission to use the papers we wanted to use with a Creative Commons CC-BY license and free of charge.

The interaction with the remaining two publishers was less pleasant. I first thought that Springer was easy, since they have a web interface for Rights & Permissions and this web interface grants you the right to use articles in other compilations and so on provided you are the author. However, the automatically generated permission letters explicitly exclude online publications without password protection and refer authors to Springer's Rights & Permissions department for such usage.

I sent several emails to Springer and got impersonal replies without a name of the sender. I called several times and I guess I interacted with three or four employees of the Rights & Permissions section. The answer I got was: "We cannot grant you the right to put copyrighted material on a webpage". I explained in emails and during phone calls that we did not want to upload the original articles into repositories or onto any other webpage but that we wanted to edit, reformat, and publish the papers by Tilman Höhle in a collection of his work, something that is usual and was possible up to the recent changes in the publishing world. For one paper, it turned out that the rights of the papers in the relevant publication reverted back to the authors, so we can use *Verum focus* in the intended way. But for *Reconstruction and coordination* I got the repeated reply that there is no way to use this paper in publications that are available online without a paywall. This would just not get into my head. Springer sells the open access option (CC-BY) to authors of new articles for \$3.000/2.200e+VAT,<sup>1</sup> but there is no way to turn a book chapter from 1991 into open access? Not even for money? The argument was: it would be unfair to readers who buy the complete book. What? I really love this appeal to fair play! What about the readers of journals that appear in print and online? Is their subscription fee of the print version lowered when the journal contains papers whose authors paid to have their content open access?

My conclusion from this was that Springer is not just a greedy company with a profit rate of more than 35 %, Springer is really an obstacle for science, their in-

<sup>1</sup> http://www.springer.com/gp/open-access/springer-open-choice, 23.09.2015.

### Preface

terests are fundamentally different from ours. So, I wrote a letter to Jolanda Vogt, who is responsible for linguistics at Springer, and to Susanne Wurmbrand, who is the editor of the *Journal of Comparative Germanic Linguistics*, and informed them that I find Springer's policy regarding rights unbelievable and that I would stop working for Springer immediately (I am on the board of *Journal of Comparative Germanic Linguistics* and do a lot of reviewing for *NLLT*, *Journal of Comparative Germanic Linguistics* and *Research on Language and Computation*). Ms. Vogt contacted Rights & Permissions and we then got a quick reply giving us the permission to use the paper in an open access publication and with 100 printed copies (which is what we estimated when we filled in the first permissions form).

I was happy, but when reading the fine print, we discovered that the rights were not sufficient. What is needed for open access as we understand it at Language Science Press is a Creative Commons CC-BY license (Shieber 2012). There are extensions of this license by NC and ND components. NC means that commercial use is not allowed without special permission and ND stands for no derivatives and means that third parties may not produce other compilations that include work under this license. In order to be able to print books via Print on Demand services, we have to have the right to sublicense the use of a book to a commercial enterprise. This would be made impossible by the NC clause. The same is true for uploading books on platforms like Google Books. Since Google is a commercial enterprise, we cannot sublicense our books to them if we do not have the permissions of the rights holders.

So, I went into the next round of emailing. The result now is that the Springer paper will be published under a CC-BY-NC-ND license and that we have the right to sublicense for PoD for 100 books.

The interaction with De Gruyter was a little more pleasant, but rather chaotic. We got the offer to buy the right to republish as open access right away and the prices were … shocking. After all we are talking about papers from the 80ies and 90ies. Nobody will buy these books anymore. Contracts from Niemeyer stated that the copyright returns to the author once the work goes out of print. Nowadays nothing goes out of print since we have print on demand, but nobody will buy these books either.<sup>2</sup> The only commercial value of such old papers is bundled content and this is what the bigger commercial publishers are selling (Shieber 2013).<sup>3</sup>

After several rounds of emailing and a request to Anke Beck, the CEO of De

<sup>2</sup>The conference volume in which Höhle (1986) appeared is now sold for 119,95e/\$168.00, which definitely prevents interested readers from buying it.

<sup>3</sup>Höhle (1986) is not even available as PDF from De Gruyter. The book is not listed in the directory of deliverable books and hence not available in normal bookstores. The content is simply blocked by De Gruyter until somebody pays for digitization.

### References

Gruyter, we arrived at a CC-BY-NC-ND license for six papers for 1.273,30 e in total and De Gruyter stated that they explicitly wanted to exclude aggregation of text material. The negotiation process and its results are summarized in Table 2. My mail folder on the rights issue contains 107 emails not including the ones I wrote.


Table 2: Interaction with publishers and results

In hindsight I regret that I did not document the time that it took me to do all these negotiations, inform my co-editors and Language Science Press staff, discuss things and react again. I am sure that these negotiations wasted at least the same amount of time at the other side (Springer, De Gruyter). This is highly inefficient. The public sector pays for these publishing houses. We pay the rights and permissions departments of the publishers. This is part of the book prices that libraries and individual researchers pay. In a world of true open access all this would be unnecessary.

Due to the restrictive NC-ND license we cannot distribute all papers in the same way. We think that this is a pity and it ruins the book. We decided to publish this book nevertheless and put blank pages into versions of the book for which we did not get the permissions we would need. So for instance, the De Gruyter and Springer papers will not be on Google Books. From the 101st printed copy onwards, the printed versions of this book will not contain *Reconstruction and coordination*, but blank pages with just the URL to the online version of this book.

So, the conclusion and the advice to all readers is: do not give your copyright away. Just don't! Commercial publishers will publish your paper anyway. Or even better, publish with true open access publishers that license the material under a CC-BY license.

Berlin, March 22, 2018 Stefan Müller

Preface

### **References**


### **Foreword to the second edition**

Tilman Höhle was so kind as to comment on the first edition on PaperHive. We integrated most of his comments and made some minor typographical adjustments. One change that he asked for and that deserves explicit mention is that we added a comment to the reference to Drach (1937). Höhle cites the original edition from 1937, which appeared posthumously. The second edition appeared 1939 also in the Verlag Moritz Diesterweg and was modified by the Nazis: they removed all references to the work of the Jewish authors Otto Selz and Eduard Engel. The fourth edition of this book was a photomechanical reprint of the third edition from 1940 by the Wissenschaftliche Buchgesellschaft, Darmstadt. It appeared in 1963 and was distributed as the "4th unchanged edition".

Berlin, Tübingen, Bensheim, March 26, 2019

Stefan Müller, Marga Reis, Frank Richter

### **References**

Drach, Erich. 1937. *Grundgedanken der Deutschen Satzlehre*. Frankfurt/Main: Diesterweg. [First, posthumous edition. Later editions lack references to the work of Otto Selz and Eduard Engel.]

# **Part I**

## **Topological fields**

## **Inhaltsverzeichnis**


### **Anmerkung der Herausgeber**

Das hier erstmals publizierte Manuskript " Topologische Felder", entstanden 1983 in Köln, ist ein Fragment; zur im Text angekündigten Fortsetzung und zur Ergänzung der durch " x" am Rande markierten Leerverweise (vgl. die Autoren-Fn.∗) ist es nie gekommen. Trotzdem fand diese Arbeit als 'graues Papier' – in 2 textidentischen, nur in Layout und Paginierung abweichenden Fassungen (von 1983 und 2003) – weite Verbreitung.

Die hier vorgelegte Druckfassung ist textuell unverändert, jedoch dem für diesen Band gewählten Druckformat angepasst. Insbesondere sind die Beispiele jetzt durchgezählt und die o. a. Leerverweise als " X" in den Text integriert; unspezifische Vorverweise wurden zusätzlich durch " [X]" markiert. Es folgen einige Hinweise zu deren Entschlüsselung, sowie zum Inhalt der geplanten Fortsetzung.

Die vorhandenen Kapitel 1–8 und darin enthaltene Vorverweise lassen erkennen, dass die weiteren Abschnitte mindestens zweierlei umfassen sollten: (i) unmittelbar anschließend die Besprechung der weiteren topologischen Satztypen – F1-Sätze und insbesondere E-Sätze (verbunden damit auch Einbettung) bzw. der weiteren topologischen Felder ('Nachfeld' und insbesondere 'Mittelfeld'); (ii) in Ausweitung von Abschnitt 8.2, die genaue Besprechung koordinativer Strukturen.

Über den mutmaßlichen Inhalt dieser Abschnitte geben separate Höhle-Arbeiten (alle wieder abgedruckt in diesem Band) zumindest partiellen Aufschluss: Zu (i) vgl. Höhle (1986), dort auch Skizze der Geschichte der Felderterminologie; zu (ii) vgl. die Trias Höhle (1983), Höhle (1990) und vor allem Höhle (1991). – Ob (iii) Wortstellungsregeln für nicht-verbale Konstituenten nochmals eigens aufgegriffen werden sollten, ist unklar; jedenfalls waren schon bei Entstehung der vorliegenden Arbeit Höhles Ansichten hierzu detailliert niedergelegt, vgl. Höhle (1982) (siehe auch Autoren-Fn.∗).

Auf diesem Hintergrund lassen sich die mit X bzw. [X] markierten Leer- und Vorverweise grob wie folgt aufschlüsseln:


1 Topologische Felder

### **Literatur**


### **Chapter 1**

## **Topologische Felder**

Tilman N. Höhle

### **1 Starke und schwache Regeln<sup>∗</sup>**

**1.1** Unter der Rubrik " Order as a Morphemic Element" unterscheidet Harris (1951: 184–186) drei Typen von topologischen Beziehungen zwischen Morphem- (komplex)en:

	- b. restricted (oder: automatic) order: there is no contrast between two arrangements of a given set of morphemic segments, but only one of these arrangements occurs
	- c. descriptively equivalent order (oder: not ordered): where the order of morphemic segments in an utterance is free; i.e. the morphemes occur in any order, with no attendant difference in the larger contextual environment or in the social situation.

In Sprachen wie dem Deutschen ist es oft unklar, wie die Unterscheidung zwischen diesen Typen anzuwenden ist. Das hängt u. a. mit der Frage zusammen, was unter " contrast" zu verstehen ist. Harris meint damit: " differences in form

<sup>∗</sup>Dies ist eine vorläufige Fassung der einleitenden Abschnitte eines längeren Manuskripts mit gleichem Titel. Einige Verweise auf spätere Abschnitte (am Rand durch " ×" markiert) sind noch nicht ausgeführt. Für einige Verweise über stilistisch (nicht-) normale Wortstellung vgl. vorerst Höhle, Explikationen für " normale Betonung" und " normale Wortstellung", in: *Satzglieder im Deutschen*. – Tübingen: Narr 1982. [s.o. Anm. S. 4]

Tilman N. Höhle. 2019. Topologische Felder. In Stefan Müller, Marga Reis & Frank Richter (Hrsg.), *Beiträge zur deutschen Grammatik. Gesammelte Schriften von Tilman N. Höhle. Zweite durchgesehene Auflage*, 7–89. Berlin: Language Science Press. DOI:10.5281/zenodo.2588347

that correlate regularly with differences in environment and meaning" (S. 184) und " differences in contextual environment and in social situation" (S. 186). Aber wie weit oder eng der Begriff 'social situation' zu fassen ist, ist nicht klar.

**1.2** Daneš (1967) hat eine differenziertere Taxonomie vorgeschlagen. Er unterscheidet vier Typen von topologischen Beziehungen:

(2) a. grammaticalized order:

" In cases where the opposition between two syntactic categories is implemented (realized) by two different positions of the element in the sentence pattern (the order being thus a distinctive feature), the corresponding rules may be called 'functional rules' and the order of elements may be termed 'grammaticalized'." (Daneš 1967: 500f.)

b. fixed order:

" in some instances the position of an element is 'fixed', and yet the violation of the rule fixing its position in the sentence does not lead to a different sentence (with other grammatical relations between the elements); the result will only be an 'ungrammatical' or 'less grammatical' form of the original sentence. The position of the elements in the sentence is then only a concomitant ('redundant', not distinctive) feature of their syntactic function." (Daneš 1967: 501)

c. usual vs. marked order:

" In the third case, a certain order of elements is 'usual'; any deviation from this order, permitted by the 'weak' rule and motivated by special non-grammatical conditions, is associated with the feature of 'nonneutrality' or 'markedness'." (Daneš 1967: 501)

d. labile order:

" In languages with the so-called 'free' word order, we must consider a fourth possibility, i.e., a 'labile' order. In this case, the order of some elements of the pattern on the grammatical level is irrelevant; in utterances based on such a pattern, the position of the respective words vacillates according to non-grammatical conditions." (Daneš 1967: 501)

Die Regeln für grammaticalized und für fixed order – also functional rules und concomitant rules – faßt er als 'strong rules' zusammen; davon zu unterscheiden sind dann weak rules (für usual vs. marked order) und 'free rules' (für labile order) (S. 506).

Die grammaticalized order von Daneš entspricht etwa der contrastive order von Harris, ist jedoch wesentlich schärfer bestimmt, da Daneš nicht allgemein

### 1 Topologische Felder

von " contrast" spricht, sondern von " opposition between two syntactic categories"; sein Beispiel ist das S*>*V*>*O-Muster<sup>1</sup> des Englischen (S. 501). Die labile order von Daneš fällt sicherlich unter die descriptively equivalent order von Harris, und Danešs fixed order entspricht weitgehend der restricted order von Harris. Die Einführung von 'usual order' bei Daneš erlaubt es jedoch, gewisse Zweifelsfälle besser als bei Harris zu klassifizieren.

Was er mit " usual" bzw. " non-neutral/marked" meint, erläutert Daneš im Anschluß an Jakobson (1963 [1966]) mit Hilfe eines russischen Satzes, der 3 Wörter enthält. Alle 6 logisch möglichen Anordnungen der Wörter sind (bei konstanten syntaktischen Funktionen der Wörter) grammatisch möglich; in diesem Fall ist also keine strong rule wirksam. Aber nur einer unter den 6 Sätzen ist " stylistically neutral" (Jakobson 1963 [1966]: 268); dieser hat nach Daneš usual order. Die anderen 5 Sätze " are experienced by native speakers and listeners as diverse emphatic shifts" (1963 [1966]: 269); sie haben nach Daneš marked order. Daneš erläutert weiter:

(3) " we come to the conclusion that the variations are motivated by their contextual (and situational) dependence and applicability (even the neutral variant clearly presupposes a certain context, or, more precisely, a certain class of contexts). In other words: every utterance points to a 'consituation'" (Daneš 1967: 504)

Bei Harris wäre nicht klar, ob die verschiedenen nicht-neutralen, markierten Varianten unter contrasting order oder unter descriptively equivalent order fallen.

An den deutschen Sätzen in (4) kann man sich das Problem verdeutlichen (Unterstreichung steht für Betonung):

	- b. Karl hat den Fund den Passanten gezeigt

Beide Sätze sind akzeptabel, und die einander entsprechenden Wortgruppen haben die gleiche syntaktische Funktion; die Sätze haben – in einem engen Sinne

<sup>1</sup>Wenn A und B syntaktische Elemente sind, bedeutet " A*>*B": Das Element A steht vor (aber nicht unbedingt: unmittelbar vor) dem Element B. " *>*" bezeichnet also eine irreflexive, asymmetrische transitive Relation; ich gehe hier davon aus, daß sie konnex ist. (In der Theorie der koordinierten Konstruktionen kann es sinnvoll sein, auf diese letzte Annahme zu verzichten; das liegt aber jenseits der Gegenstände dieses Kapitels.)

Die intransitive Relation " steht unmittelbar vor" bezeichne ich durch das Verkettungszeichen (z. B.: " A ⌢B"). In der Literatur werden diese zwei " vor"-Relationen gewöhnlich nicht explizit unterschieden und beide durch einfaches Hintereinanderschreiben (z. B.: " AB") bezeichnet.

des Wortes – die gleiche Bedeutung (logische Charakterisierung). In einem weiten Sinne von " semantisch" weisen sie jedoch semantische Unterschiede auf; jedenfalls gibt es, wie man sich leicht klarmachen kann, Unterschiede in den Gebrauchsmöglichkeiten der Sätze (vgl. X, [s. Anm. S. 4]). Reicht das aus, um einen " contrast" im Sinne von Harris zu etablieren? Mit dem Unterschied zwischen *John saw Bill* und *Bill saw John* möchte man den Unterschied zwischen (4a) und (4b) nicht gleichsetzen; aber wenn die Gebrauchsunterschiede zwischen ihnen unter " differences in contextual environment and in social situation" fallen, muß man den topologischen Unterschied zwischen ihnen als contrasting order bezeichnen. Tut man es nicht, müßte descriptively equivalent order vorliegen. Zu dieser Kategorie gehören vermutlich Satzpaare wie (5):

	- b. gestern hat Karl uns geholfen

Irgendwelche semantischen Unterschiede sind hier schwer auszumachen; in dieser Hinsicht besteht ein Unterschied zwischen (4) und (5). Bei Daneš ist dagegen klar, daß der Unterschied in (4) als usual gegenüber marked order zu beschreiben ist; der Unterschied in (5) dürfte dagegen unter labile order fallen.

Wenn man die Existenz von labile order in Betracht zieht, entsteht allerdings eine Schwierigkeit, die Erklärung von 'marked order' wortgetreu anzuwenden. Ein Beispiel dafür könnte (6) sein:

(6) geholfen hat Karl uns gestern

Der Satz scheint gegenüber (5) stilistisch markiert zu sein (vgl. X, [s. Anm. S. 4]), müßte also auf die Wirkung einer weak rule zurückgehen. In (2c) ist aber vorausgesetzt, daß es genau 1 usual order gibt, der gegenüber eine nicht-neutrale Wortfolge 'markiert' ist; in (5) haben wir deren zwei. Die Erklärung von 'marked order' bedarf also einer Korrektur, und generell bedürfen die Begriffe der 'usual' bzw. 'neutral order' und der 'marked' bzw. 'non-neutral order' einer genaueren Explikation. Es ist auch gar nicht ohne weiteres klar, ob und gegebenenfalls in welcher Weise diese Begriffe für eine sprachwissenschaftliche Theorie überhaupt von Belang sind. Mit diesen Fragen setzen wir uns in X [s. Anm. S. 4] auseinander; vorläufig versuchen wir die Begriffe so intuitiv zu verwenden, wie sie eingeführt sind.

In vielen Zusammenhängen kann man auch ohne Schaden darauf verzichten, die Schwierigkeiten mit usual/marked order vorweg zu klären. Häufig ist es sinnvoll, einfach zwischen starken Regeln (= strong rules im Sinne von Daneš) und allen anderen topologischen Regeln zu unterscheiden. Regeln, die keine starken

### 1 Topologische Felder

Regeln sind, bezeichne ich als schwache Regeln. Danešs weak rules und free rules sind also schwache Regeln in meinem Sinne.

**1.3** Es drängt sich auf, in der Topologie des Deutschen zwei große Phänomenbereiche zu unterscheiden: (a) den Bereich der starken Regeln; darunter fallen vor allem wesentliche Teile der Syntax von Nominalphrasen und die Lehre von den topologischen Feldern des Satzes;<sup>2</sup> und (b) den Bereich der schwachen Regeln; darunter fallen besonders jene Elemente, die mehr oder minder gut ihre Stellung innerhalb der topologischen Felder oder zwischen ihnen verändern können. Es ist klar, daß schwache Regeln innerhalb von topologischen Bezirken operieren, die durch starke Regeln abgegrenzt und definiert werden. So unterliegen die Bestandteile eines einfachen Satzes in vielen Sprachen (z. B. im Russischen) keinen oder nur wenigen starken Regeln, aber innerhalb eines komplexen Satzes bilden die Teile eines Teil-Satzes gewöhnlich eine zusammenhängende Kette. Ähnliches scheint, wie wir sehen werden, für die topologischen Felder zu gelten.

In den folgenden Abschnitten bespreche ich einige Grundzüge der Lehre von den topologischen Feldern des Satzes. Diese Lehre bietet einerseits den Rahmen, der für eine Erörterung normaler (usual), markierter und freier Wortstellung vorauszusetzen ist; die Phänomene, die von dieser Lehre erfaßt werden, sind fundamental für die gesamte Satzlehre des Deutschen. Zugleich präsentiert sich das Deutsche in dieser Lehre als eine 'exotische' Sprache: Eine Kombination von Phänomenen dieser Art ist unter den Sprachen der Welt außerordentlich selten; genauer: Sie ist in dieser Weise überhaupt nur aus dem Deutschen und dem Niederländischen bekannt. Die wenigen Sprachen, aus denen ähnliche Phänomene bekannt sind (das sind vor allem die nordgermanischen und keltischen Sprachen), zeigen sie in anderer Kombination oder weniger deutlich. Diese Phänomene stellen einer auf theoretisches Verständnis abzielenden Syntaxforschung eine Reihe von sehr klaren Aufgaben, die sich bislang einer befriedigenden Lösung entziehen.

Die Lehre von den topologischen Feldern besteht – nicht unter diesem Namen, aber in ihren wesentlichen Inhalten – seit mindestens 100 Jahren in gereifter Form. Das heißt jedoch nicht, daß sie allgemein verstanden und akzeptiert ist; bis in die jüngste Gegenwart hinein zeigen sich auch Fachleute manchmal un-

<sup>2</sup>Damit ist der Teil der Syntax gemeint, der sich mit den Stellungsmöglichkeiten der (finiten oder infiniten) Verben und den damit zusammenhängenden Fragen beschäftigt. In diesem Zusammenhang wird oft von verschiedenen " Feldern" im Satz gesprochen, z. B. von Vorfeld, Satzfeld, Mittelfeld, Hauptfeld, Nachfeld. Die Terminologie ist uneinheitlich und z. T. nicht ganz adäquat, beruht aber auf einigen wichtigen Einsichten.

zureichend unterrichtet. Es scheint mir deshalb günstig, auf die Exposition der Lehre durch eine kritische Besprechung einer besonders einflußreichen Abhandlung über topologische Phänomene hinzuleiten: Greenbergs " Some universals of grammar with particular reference to the order of meaningful elements" (1963 [1966]).

Bevor wir uns Greenbergs Bemerkungen über das Deutsche zuwenden, sind jedoch einige Überlegungen zu seiner Terminologie nötig.

### **2 Dominante Wortstellung**

**2.1** Der zentrale Begriff in Greenbergs Ausführungen über die topologischen Eigenschaften von Verben ist 'dominant'. Der Ausdruck wird folgendermaßen eingeführt:<sup>3</sup>

	- b. The vast majority of languages have several variant orders but a single dominant one.
	- c. Logically, there are six possible orders: SVO, SOV, VSO, VOS, OSV, and OVS.
	- d. Of these six, however, only three normally occur as dominant orders.
	- e. The three which do not occur at all, or at least are excessively rare, are VOS, OSV, and OVS." (Greenberg 1963 [1966]: 76)

Eine nähere Erläuterung dafür, wodurch sich eine dominante Stellung gegenüber anderen Stellungen auszeichnet, gibt es nicht.

Die Formulierung in (7b) läßt mehrere Deutungen zu. Die schwächste – eine, die für eine vernünftige Interpretation von Greenbergs Aufsatz auf jeden Fall angenommen werden muß – formuliere ich in (8):

	- b. Für die meisten L<sup>i</sup> : In L<sup>i</sup> ist genau 1 Wortstellung dominant. (Vgl. (7b).)

Die Formulierung in (8a) läßt zu, daß in einer Sprache L<sup>j</sup> nur eine einzige Stellung existiert, daß es also grammaticalized oder fixed order im Sinne von (2a,b) gibt.

<sup>3</sup>Man beachte: Wenn Greenberg " AB" oder " ABC" schreibt, ist immer " <sup>A</sup>*>*B" bzw. " A*>*B*>*C" gemeint.

### 1 Topologische Felder

Offensichtlich sollen Greenbergs verschiedene Hypothesen auch für einen solchen Fall gelten; ich nehme deshalb an, daß eine Stellung auch dann 'dominant' ist, wenn sie die einzig mögliche ist. Diese Annahme wird durch die Ausführungen über Adjektive gestützt:

(9) " The third basis of classification will be the position of qualifying adjectives […] in relation to the noun. […] Here again there is sometimes variation, but the vast majority of languages have a dominant order." (Greenberg 1963 [1966]: 77)

Wenn die Stellung der Adjektive nur " sometimes" variiert, muß sie in den meisten Sprachen stabil sein; wenn " the vast majority of languages" eine dominante Stellung von Substantiv zu Adjektiv hat, müssen darunter also Sprachen mit nicht-variierender Stellung sein.

Die Formulierung in (8b) läßt zu, daß in einer Sprache L<sup>k</sup> zwar mehrere verschiedene Stellungen existieren, unter diesen aber keine irgendwie (z. B. als 'dominant') ausgezeichnet ist, daß es also labile order im Sinne von (2d) gibt. Sprachen wie L<sup>j</sup> und L<sup>k</sup> sind nach (8) aber in der Minderzahl. Ähnlich wie Daneš in (2c) scheint Greenberg nach (8b) anzunehmen, daß es dann, wenn in L<sup>i</sup> verschiedene Stellungen existieren und diese nicht gleichwertig sind, genau eine (als 'dominant') ausgezeichnete Stellung gibt. (Dies ist problematisch, wie wir an (6) gesehen haben.) Das " normally" in (7d) muß man (wegen des Zusammenhangs mit (7e)) offenbar als " häufig" oder " meistens" lesen; ich paraphrasiere die Folge (7c–e) so:

	- b. Es gibt eine Menge WO<sup>t</sup> , WO<sup>t</sup> *⊂* WOm, für die gilt:
		- i. Für die weitaus meisten L<sup>i</sup> gilt: L<sup>i</sup> hat ein Element aus WO<sup>t</sup> als dominante Wortstellung. (Vgl. (7d).)
		- ii. WO<sup>t</sup> = {S*>*V*>*O, S*>*O*>*V, V*>*S*>*O}. (Vgl. (7e).)

Nach dieser Interpretation ist es durchaus möglich, daß eine Sprache L<sup>1</sup> – in Sätzen, die durch (7a) charakterisiert sind – die Stellung V*>*O*>*S, O*>*V*>*S oder O*>*S*>*V aufweist und dennoch zum Normaltypus der Sprachen gehört, wie er in (10b) gekennzeichnet ist; diese Stellungen dürfen in L<sup>l</sup> nur nicht dominant sein.

Die in (8) und (10) formulierte Deutung gibt, so weit ich sehe, die einzige Möglichkeit an die Hand, die Abschnitte 2–4 von Greenbergs Aufsatz als konsistenten Text zu interpretieren.

**2.2** Im abschließenden Abschnitt 5 verwendet Greenberg den Ausdruck " dominant" unvermittelt in völlig anderer Weise. Er spricht dort von " dominance of a particular order over its alternative" und sagt u. a.:

(11) " Since the nominal object may follow the verb whether the pronoun object precedes or follows, while the nominal object may precede the verb only if the pronoun precedes, we will say that VO is dominant over OV since OV only occurs under specified conditions, namely when the pronominal object likewise precedes, while VO is not subject to such limitations." (Greenberg 1963 [1966]: 97)

Hier werden verschiedene Sprachen miteinander verglichen, für die eine dominante Wortstellung im Sinne von (8b) bereits etabliert ist. Für nominale Subjekte und Objekte z. B. ist im Französischen wie im Englischen S*>*V*>*O die (einzelsprachlich) dominante Stellung, völlig unabhängig davon, welche Stellung ein pronominales Objekt einnimmt. In (11) heißt es, V*>*O sei " dominant" gegenüber O*>*V *deshalb weil* (oder: insofern als) nominale O*>*V-Stellung nur zusammen mit pronominaler O*>*V-Stellung vorkommt, während nominale V*>*O-Stellung zusammen mit pronominaler V*>*O-Stellung (wie im Englischen) oder zusammen mit pronominaler O*>*V-Stellung (wie im Französischen) vorkommt. Das hat nur Sinn, wenn " dominant" hier in einem typologischen Sinne gemeint ist und nicht, wie in (8b), in Hinsicht auf eine Einzelsprache. Dies kann man so erläutern:

	- a. i. Es gibt Sprachen, die die (einzelsprachlich dominante) Wortstellung A*>*B aufweisen.
		- ii. Einige dieser Sprachen, aber nicht alle, haben die Eigenschaft *E*.
	- b. i. Es gibt Sprachen, die die (einzelsprachlich dominante) Wortstellung B*>*A aufweisen.
		- ii. Alle diese Sprachen haben die Eigenschaft *E*.

Ich sehe nicht, wie man Greenbergs Abschnitt 5 verstehen könnte, wenn man dort " dominant" nicht als " typologisch dominant" im Sinne von (12) interpretiert.

Von dem Begriff 'einzelsprachlich dominant' unterscheidet sich 'typologisch dominant' nicht nur durch den notwendigen Bezug auf verschiedene Sprachen, sondern auch dadurch, daß er ein notwendig relationaler Begriff ist. Im Zusammenhang mit (8) habe ich angemerkt, daß in einer Sprache L<sup>i</sup> eine Stellung A*>*B

### 1 Topologische Felder

offenbar auch (und immer) dann 'dominant' ist, wenn die Stellung B*>*A in L<sup>i</sup> nicht vorkommt, und unter der inhaltlichen Deutung von 'einzelsprachlich dominant', die in 2.3 zur Sprache kommt, erweist sich das auch als völlig natürlich. Wenn man eine Stellung auch dann typologisch dominant nennen würde, wenn (12b-i) nicht erfüllt wäre, wäre dies ein inhomogener Begriff. Denn dann wäre es widersinnig, die Forderung (12a-ii) aufzustellen. Auf diese Forderung kann man aber nicht verzichten, wenn (12b-i) erfüllt ist.

Eine natürliche Folge von (12) ist, daß es typologisch dominante Wortstellungen gibt, die in manchen Einzelsprachen überhaupt nicht vorkommen. Im Japanischen etwa ist O*>*V (einzelsprachlich) dominant und V*>*O inexistent; trotzdem ist V*>*O nach (11) typologisch dominant. Dementsprechend ist es auch möglich, daß eine typologisch dominante Wortstellung A*>*B in weniger Sprachen vorkommt als ihr 'rezessives' Gegenstück.

Diese Interpretation wird unmittelbar bestätigt durch folgende Erläuterung:

(13) " Note that the notion of dominance is not based on its more frequent occurrence but on the logical factor of a zero in the tetrachoric table. It is not difficult to construct an example in which one of the recessive alternatives is more frequent than the dominant. Dominance […] relations can be derived quite mechanically from such a table with a single zero." (Greenberg 1963 [1966]: 97)

In einer tetrachoric table werden verschiedene topologische Eigenschaften korreliert; in den Zellen der Tabelle ist angegeben, wieviele Sprachen die jeweilige Korrelation (von einzelsprachlich dominanten Wortstellungen verschiedener Art) erfüllen. Für die in (11) erwähnte Stellung von nominalen und pronominalen Objekten zu Verben sähe das etwa so aus (*i, j, k >* 0):

$$\begin{array}{c c c c} \text{(14)} & \text{nominal} & \text{O>V} & \text{V>O} \\ & \text{pronomial} & & \\ & \text{O>V} & i & j \\ & \text{V>O} & \text{0} & k \\ \end{array}$$

Das heißt: In *i* Sprachen stehen nominale wie pronominale Objekte vor dem Verb; in *k* Sprachen folgen beide auf das Verb; in *j* Sprachen folgt ein nominales Objekt auf das Verb, wärend ein pronominales Objekt vor dem Verb steht (jeweils in der dominanten Stellung). Aus der Tabelle geht hervor, daß für nominale Objekte die Wortstellung V*>*O (hinsichtlich der Stellung von pronominalen Objekten relativ zum Verb) gegenüber O*>*V typologisch dominant ist (weil

die Kombination pronominal V*>*O/nominal O*>*V in keiner Sprache vorkommt).<sup>4</sup> Dabei könnte *i* durchaus größer sein als *j* und/oder als *k*.

Daß Greenberg zwei ganz verschiedene Begriffe – '(einzelsprachlich) dominant' und 'typologisch dominant' – verwendet, ist häufig übersehen worden. So beginnt Daneš den Aufsatz, aus dem wir in 1.2 zitiert haben, mit den Worten:<sup>5</sup>

(15) " In his paper "Some Universals of Grammar", J. H. Greenberg introduces the notion of dominant order of syntactic elements and explains (p. 76) that the "dominance is not based on its more frequent occurrence" (a dominant order is not that alternative which is more frequent than its opposite, the 'recessive' order) but on the fact that the dominant order can always occur while its opposite is present only under specified conditions, i.e., in cooccurrence with another, 'harmonic', construction. These conditions are stated in terms of grammatical notions, such as Verb, Object, Pronominal Object, etc.

R. Jakobson […] very aptly shows that in Slavic languages the 'recessive alternatives' to a 'dominant order' are numerous. The Russian sentence corresponding to "Lenin cites Marx" may occur in six different variants. […] It is worth noting that all the six logically possible orders may occur, even those three that, according to Greenberg, "do not occur at all, or at least are excessively rare", namely VOS, OSV, OVS. Jakobson also points out that the conditions by which the occurrence (selection) of the different variants is regulated are not of grammatical character" (Daneš 1967: 499)

Daneš umschreibt hier Greenbergs Ausführungen zum Begriff der typologischen Dominanz, unterstellt aber offenbar – und kritisiert –, daß damit der Begriff der (einzelsprachlich) dominanten Wortstellung erläutert werden soll. Daneš weist zu Recht darauf hin, daß unter dieser Interpretation widersprüchliche Ergebnisse folgen. Aber Danešs Unterstellung ist offensichtlich ein Irrtum: " (einzelsprachlich) dominant" wird bei Greenberg überhaupt nicht erläutert; " typologisch dominant" wird zwar erläutert, hat mit (einzelsprachlich) dominant oder mit " normal" in Danešs Sinn aber nur indirekt ewas zu tun.

**2.3** Aber was meint Greenberg mit " (einzelsprachlich) dominant"? Möglicherweise tatsächlich so etwas wie Jakobsons 'stilistisch neutrale' und Danešs 'nor-

<sup>4</sup>Aus denselben Gründen ergibt sich für pronominale Objekte umgekehrt, daß O*>*V gegenüber V*>*O (hinsichtlich der Stellung von nominalen Objekten zum Verb) typologisch dominant ist. <sup>5</sup>Daneš zitiert nach der 1. Auflage von Greenberg (Hrsg.) (1966). Die beiden Auflagen sind (mit unwesentlichen Ausnahmen) textidentisch, aber verschieden paginiert. Die Angabe " (p. 76)" in (15) verweist auf das Textstück, aus dem (11) und (13) stammen.

### 1 Topologische Felder

male' (usual) Wortstellung. Als Indiz kann man einige andere Adjektive aufführen, die Greenberg, wie es scheint, in demselben Sinn wie " dominant" gebraucht.

An mehreren Stellen steht " normal", wo man aufgrund des Textzusammenhangs " dominant" erwarten könnte. So werden die Sprachen gemäß (7) u. a. danach klassifiziert, ob ihre dominante Abfolge von Subjekt, Objekt und Vollverb V*>*S*>*O, S*>*V*>*O oder S*>*O*>*V ist; diese Stellungstypen werden als I, II und III bezeichnet (S. 77). Auf S. 108 wird dann eine Tabelle mit den Worten erläutert: " I indicates that normal word order is verb-subject-object". Hier wird also " normal" in genau derselben Weise gebraucht wie zuvor " dominant". Ebenso z. B. S. 79 (Universal 4), S. 83f (mehrfach, u. a. Universals 14 und 15), S. 91: " in Masai, whereas normal order for nominal object is VSO …". In Universal 23 (S. 89f) findet sich " usually"; auch " usual" wird verwendet: " In Nubian, the usual nominal order is SOV, but the alternative SVO is fairly frequent" (S. 91). Dort auch " regularly": " No contrary instances occur in the sample of a pronominal object regularly following the verb …" (S. 91).

Es scheint danach, daß durch " dominant" eine Eigenschaft bezeichnet wird, die eng verwandt ist mit intuitiven Begriffen der Normalität und des Üblichen. Wenn man demzufolge annimmt, daß " dominant" im wesentlichen das gleiche ist wie Jakobsons " stylistically neutral", löst sich auf jeden Fall eine potentielle Schwierigkeit: daß eine Stellung A*>*B in einer Sprache L<sup>i</sup> offensichtlich 'dominant' sein soll, wenn B*>*A in L<sup>i</sup> nicht vorkommt. Denn eine Stellung für einen fundamentalen Satztyp (wie 'Deklarativsatz'), zu der es keine Alternative gibt, kann gar nicht anders als stilistisch neutral sein. (Das hindert nicht, daß ein ganzer Satztyp mit speziellen Stellungseigenschaften – etwa: Interrogativsatz oder Imperativsatz – als irgendwie 'markiert' empfunden wird.)

Zum Abschluß dieser terminologischen Erörterungen ist auf ein mögliches Mißverständnis hinzuweisen. Um die Form der Universalien zu erläutern, gibt Greenberg ein fiktives Beispiel:

(16) " If a language has verb-subject-object as its basic word order in main declarative clauses, the dependent genitive always follows the governing noun." (Greenberg 1963 [1966]: 74)

Inhaltlich entspricht das – in Verbindung mit dem Universal 2 – dem Universal 3:

(17) " Languages with dominant VSO order are always prepositional." (Greenberg 1963 [1966]: 78)

Diese Parallelität scheint dafür zu sprechen, daß " basic" in (16) synonym mit " dominant" in (17) ist. Dem steht jedoch der Wortgebrauch S. 79f entgegen:

(18) " all VSO languages apparently have alternative basic orders among which SVO always figures. On the other hand, in a substantial proportion, possibly a majority, of type III languages, the verb follows all of its modifiers, and if any other basic order is allowed, it is OSV. Thus the verb […] is always at the end in verbal sentences. It is not logically required, of course, that languages all of whose basic orders involve the verb in the third position should also require all verb modifiers to precede the verb, […]" (Greenberg 1963 [1966]: 79; Hervorhebung hinzugefügt)

So auch in Universals 6 und 7. Es kann also in einer Sprache L<sup>i</sup> z. B. die 'dominante' Stellung V*>*S*>*O geben und daneben noch alternative " basic orders"; mithin ist nicht jede 'basic order' zugleich eine 'dominant order'. Aber was ist dann eine 'basic order'? Die einzige konsistente Interpretation, die mir möglich scheint, ergibt sich aus der Einführung in die 'basic order typology':

	- b. This typology will be referred to as the basic order typology.
	- c. Three sets of criteria will be employed.
	- d. The first of these is the existence of prepositions as against postpositions. […]
	- e. The second will be the relative order of subject, verb, and object […]." (Greenberg 1963 [1966]: 76)

(Der Ausschnitt (19e) ist in (7) ausführlicher zitiert. Der dritte set of criteria ist die in (9) zitierte Stellung von Adjektiven zu Substantiven.)

Mit " basic factors" in (19a) sind vermutlich 'grundlegende, fundamentale' Faktoren gemeint und nicht 'einzelsprachlich dominante' Faktoren; so auch bei " Basic Data on the 30-Language Sample" (S. 107). Demnach ist die " basic order typology" von (19b), die im Text häufig erwähnt wird, eher eine order typology, die 'basic' ist, als eine Typologie von 'basic orders'. Entsprechend ist auch einfach von " the basic typology" (S. 91) die Rede. Die " Basic Order Types" (S. 108f), die sich aus dieser Typologie ergeben, sind nicht Typen von 'basic orders', sondern Sprachtypen, die durch die verschiedenen Kombinationen der " basic factors of word order" charakterisiert sind. Wenn im Zusammenhang mit der Stellung von Subjekt, Objekt und Verb von " basic order" die Rede ist, wie es in (16) und (18) der Fall ist, dürften deshalb die Bedingungen von (19e) gemeint sein: nominales (und nicht pronominales) Subjekt und Objekt in Deklarativsätzen (und nicht z. B. in Imperativ- oder Interrogativsätzen). Gewöhnlich ist dann eine der Stellungen,

### 1 Topologische Felder

die im Sinne von (19e) 'basic' sind, 'dominant' im Sinne von 'normal' oder 'usual'. Aufgrund dieser dominanten Stellung bezeichnet Greenberg eine Sprache als 'VSO-Sprache', 'SVO-Sprache' oder 'SOV-Sprache'.

Es wäre hilfreich, wenn sich die Vermutungen, die wir über Greenbergs Terminologie angestellt haben, irgendwie erhärten ließen. Aber ich sehe keine Möglichkeit, aus seinem Text genaueren Aufschluß zu erhalten. Im folgenden unterstelle ich, daß unsere Vermutungen nicht in schädlicher Weise unzutreffend sind.

### **3 Deklarativsätze: Deutsch als S***>***V***>***O-Sprache?**

Nach diesen Präliminarien kommen wir zu Greenbergs Bemerkungen über das Deutsche. Das Deutsche spielt in seinem Aufsatz eine eigenartige Rolle. Es gehört nicht zu den 30 Sprachen, auf deren Analyse die Universalien basieren; aber Greenberg macht im Appendix II inhaltliche Aussagen über das Deutsche, und an zwei Textstellen (S. 82, 104) zieht er das Deutsche heran, um seine Ausführungen zu illustrieren. Dabei verwendet er deutsche Sätze, ohne ihren Aufbau genauer zu erläutern oder eine Übersetzung anzugeben.

### **3.1 Finite und infinite Verben**

**3.1.1** Nach der Übersicht in Appendix II gehört das Deutsche (wie auch das Niederländische) zu den S*>*V*>*O-Sprachen (S. 109, Nr. 10). Das bedeutet, wie aus (7) hervorgeht:

(20) In deklarativen Sätzen mit nominalem Subjekt und Objekt hat das Deutsche die Folge S*>*V*>*O als einzige dominante Stellung.

Worauf könnte sich diese Behauptung stützen? Wir finden Beispiele wie (21):

	- b. Karl brachte die Kartoffeln

Offensichtlich weisen sie S*>*V*>*O-Stellung auf. Aber ist dies der einzige Typ von deklarativen Sätzen mit nominalem Subjekt und Objekt, die im Deutschen dominante Stellung haben? Wir finden auch Beispiele wie (22):

	- b. Karl soll die Kartoffeln bringen

Diese Sätze sind intuitiv in keiner Weise 'markiert', sie sind stilistisch neutral in Jakobsons Sinn. Ich sehe keinen Grund, anzunehmen, ihre Wortstellung sei nicht dominant. Sie weisen jedoch nicht S*>*V*>*O-Stellung auf, sondern S*>*O*>*V.

Um dies zu erkennen, muß man auf Greenbergs Ausführungen zu Hilfsverben eingehen:

(23) " Another relation of verb to verb is that of inflected auxiliary to main verb. For present purposes, such a construction will be defined as one in which a closed class of verbs (the auxiliaries) inflected for both person and number is in construction with an open class of verbs not inflected for both person and number. For example, in English 'is going' is such a construction." (Greenberg 1963 [1966]: 84)

Darauf folgt eine Korrelationstabelle, in der die Eigenschaften " Auxiliary precedes verb" und " Auxiliary follows verb" auftreten.

Greenberg unterscheidet also zwischen (flektiertem) Hilfsverb<sup>6</sup> und Verb (Vollverb, Hauptverb), und wenn von den topologischen Beziehungen zwischen Subjekt, Objekt und 'Verb' die Rede ist, ist immer das Vollverb gemeint. Das muß man aus der Erörterung von Fragesätzen schließen. Greenberg will illustrieren, daß in manchen Sprachen eine Wortgruppe, die ein Interrogativpronomen enthält, an den Satzanfang tritt (so daß die Stellung, die für deklarative Sätze charakteristisch ist, in solchen Sätzen nicht gilt), und benutzt dafür das Englische:

	- b. with whom did he go?

Daran schließt sich folgender Text an:

(25) " Many languages which put interrogatives first likewise invert the order of verb and subject (e.g., German 'Wen sah er?'). Such languages sometimes invert for yes-no questions, (e.g., 'Kommt er?')." (Greenberg 1963 [1966]: 82)

Wieso führt Greenberg hier das Deutsche ein, warum reicht das Englische nicht? Offenbar deshalb, weil das *did* in (24) nicht ein 'Verb' im relevanten Sinne ist; in (24a) sieht Greenberg offensichtlich eine Manifestation der Folge O*>*S*>*V. Dasselbe gilt für Entscheidungsfragen: In *Kommt er?* hat man die Folge V*>*S; im

<sup>6</sup> Er erkennt auch die Existenz von unflektierten Hilfsverben an: " Uninflected auxiliaries will be considered later in connection with verb inflections." (Greenberg 1963 [1966]: 85). Leider geht er, entgegen dieser Ankündigung, nirgendwo auf unflektierte Hilfsverben ein.

1 Topologische Felder

entsprechenden englischen Beispiel *will he come?* hätte man nach Greenberg offenbar S*>*V-Stellung, so daß die Folge (O)*>*V*>*S, um die es in (25) geht, wieder nur am Deutschen und nicht am Englischen demonstriert werden kann.

Auf die Eigenschaften von deutschen Fragesätzen kommen wir in 4. zurück. Im Moment halten wir fest: Nach Greenberg ist ein infinites Vollverb hinsichtlich der topologischen Beziehungen zu Subjekt und Objekt ein 'Verb' (V). Beispiele wie (22) weisen daher S*>*O*>*V-Stellung auf, oder genauer:<sup>7</sup>

(26) S*>*Aux*>*O*>*V

Wir finden also nebeneinander S*>*V*>*O und S*>*O*>*V. Das sieht aus, als sei die Wortstellung im Deutschen frei ('labile'). Tatsächlich unterliegt sie jedoch strengen Restriktionen. Beispiele wie (27) mit S*>*O*>*V oder (28) mit S*>*V*>*O werden gemeinhin nicht als akzeptable Sätze des Deutschen betrachtet (oder als literarische Lizenzen gewertet, die (definitionsgemäß) ein außernormaler Phänomenbereich sind):

	- b. \* der Hund einen Hasen erblickt hat
	- c. \* der Hund einen Hasen hat erblickt
	- b. \* der Hund erblickt hat einen Hasen
	- c. \* der Hund hat erblickt einen Hasen

Unter Greenbergs Analyse wirkt das chaotisch und erweckt den Eindruck, daß es im Deutschen kein begreifbares Schema für dominante Wortstellungen gibt. (Dies ist vermutlich ein Grund gewesen, weshalb Sprecher von S*>*V*>*O-Sprachen das Deutsche jahrhundertelang als unbegreifliche und barbarische Sprache betrachtet haben.) Aber ein Sprecher des Deutschen beurteilt (27) und (28) als abweichend, obwohl er über diese oder ähnliche Beispiele nie explizit unterrichtet worden ist. Das zeigt: Der Sprecher verfügt über Regelwissen, das ihn zu solchen Urteilen veranlaßt.

<sup>7</sup>Wenn man gegen Greenberg das Hilfsverb als " V" kennzeichnet, erhält man die Folge S*>*V*>*O*>*V. Das ändert jedoch nichts Wesentliches: Wir haben die Folge O*>*V, was bei Abwesenheit des Hilfsverbs unmöglich ist. – Vielleicht findet sich eine Interpretation von " dominant", nach der solche Sätze keine 'dominante' (sondern vielleicht nur 'basic') Wortstellung aufweisen. Wie auch immer eine Typologie Greenbergscher Art die Vernachlässigung von Beispielen wie (22) rechtfertigen mag, die korrekte Analyse des Deutschen kann von ihrer Ignorierung nicht profitieren.

**3.1.2** Welche Regeln sind hier wirksam? Offenbar spielt es eine Rolle, ob V flektiert (statt dessen künftig: finit) oder infinit ist. Finitheit spielt auch beim Hilfsverb eine Rolle: Bei der Folge S*>*Aux*>*O*>*V in (22a) ist Aux finit; ein infinites Aux dagegen muß auf V folgen:

	- b. \* der Hund haben soll einen Hasen erblickt
	- c. \* der Hund haben einen Hasen erblickt soll

In (29) ist das erste Aux (*soll*) finit, und das zweite Aux (*haben*) nach dem V ist infinit. Andere Positionen der Hilfsverben wie in (30) sind nicht akzeptabel.

Man kann auf verschiedene Weisen versuchen, diese Zusammenhänge darzustellen. Die Erkenntnis, daß da eine – allerdings abstrakte – sehr einfache Regularität obwaltet, hat Herling (1821b) besonders klar formuliert:

	- b. " Da die umschriebenen Zeitformen der deutschen Conjugation die Scheidung der Aussage von dem ausgesagten Prädicate am sichtbarsten darstellen, so müssen wir die Stellung des Prädicats gegen seine Nebenbestimmungen, so wie sie bei diesen Zeitformen Statt findet, als die natürliche Stellung ansehen. Daß bei den Verben, welche mit Adverbien oder Präpositionen zusammengesetzt sind, diese an jener eigenthümlichen Stelle zurückbleiben, wenn im Präsens oder Imperfect das Prädicat mit der Aussage vereint wird, rechtfertigt diese Ansicht noch mehr, z. B. " Er hat mir gestern mein Verfahren vorgeschrieben" und: " Er schrieb mir gestern mein Verfahren vor." " (Herling 1821b: 298f)
	- c. " Wird nun das Ausgesagte, wie im Präsens und Imperfect, mit der Aussage zusammengezogen, so ändert dieses nichts an den vorstehenden Regeln von der Folge seiner Bestimmungen, und selbst die mit ihm verbundenen Adverbien und Präpositionen bleiben an der ursprünglichen Stelle zurück." (Herling 1821b: 306f)

### 1 Topologische Felder

Die Terminologie bedarf einer Erläuterung. " Prädicat" ist für Herling primär ein logischer Begriff: Ein Prädikat ist etwas, was ausgesagt wird, und zwar ausgesagt über einen Gegenstand, das " Subject"; daher heißt es auch das Ausgesagte. Sprachlich wird es dargestellt durch eine Wortform eines Vollverbs (oder durch ein prädikatives Adjektiv, Substantiv usw.). Die Verknüpfung von Subjekt und Prädikat geschieht durch die 'Aussage'; diese wird sprachlich dargestellt durch die morphologischen Charakteristika, durch die sich finite Verben auszeichnen.<sup>8</sup> Adverbiale Ausdrücke und Objekte betrachtet er als '(Neben-)Bestimmungen' des Prädikats.

Die Stellung des Hauptverbs, die bei den " umschriebenen Zeitformen" zu beobachten ist, sieht Herling als die " natürliche Stellung" an. Ein wesentlicher Grund dafür sind die Stellungsregularitäten der " (Neben-)Bestimmungen". (Auf diese Begründung gehen wir in X [s. Anm. S. 4] ein.) Die 'natürliche' Stellung wäre demnach (32):

### (32) Subjekt*>*Aussage*>*Bestimmungen*>*Prädikat

Diese Folge ist nahezu gleichwertig mit dem Schema (26). Es gibt jedoch einen entscheidenden Unterschied: " Aux" in (26) ist ein Symbol für eine Wortklasse; " Aussage" in (32) ist eine Bezeichnung für etwas, was als finites Verb realisiert wird. Diese Trennung zwischen Flexionskategorie (Finitheit) und Wortklasse (Verb) erlaubt es Herling, die wesentliche Regularität zu formulieren: Zwischen S und O steht immer die 'Aussage' (ein finites Verb). Nach dem Objekt steht das Prädikat (das Vollverb) – " wofern nicht die Aussage mit dem Ausgesagten in einem Worte vereinigt ist", wie es im Präsens und Präteritum (" Imperfect") der Fall ist. Wenn wir wie in (21) die Abfolge S*>*V*>*O finden, so manifestiert sie nach Herlings Erkenntnis nicht eine dominante Wortfolge (33a), sondern die dominante Folge (33b), und diese ist eine Variante der dominanten Wortstellung (33c), die daraus resultiert, daß das Verb in (21) finit ist:

<sup>8</sup>Mit " Aussage" übersetzt Herling den sonst – z. B. bei Vater (1805: 16ff) – üblichen Ausdruck " Copula". Später kehrt er zu diesem Ausdruck zurück und schreibt z. B.: " Diesen Grundsätzen gemäß ist die Wortfolge in den wesentlichen Theilen des Hauptsatzes […]: Subject, Copula, Prädicat. Nur, wo diese, wie in den umschriebenen Zeit- und Modusformen, getrennt erscheinen, läßt sich das Gesetz dieser Folge erkennen. Wo Prädicat und Copula zu Einem Worte verschmelzen, steht die Verschmelzung an der Stelle der Copula, des eigentlichen Verbs, und das Prädicat läßt alle, seinen Begriff näher individualisirenden Bestimmungen […] an seiner eigentlichen Stelle, an der Stelle des Prädicats, zurück […]. Dies beweist auch für die einfachen Formen, Präsens und Imperfect, daß ihre eigentliche Stelle am Ende des Hauptsatzes ist." (Herling 1830: 84)

Genau wie viele heutige Autoren befolgt Herling das (von Frege 1899 so genannte) 'Prinzip der Nichtunterscheidung des Verschiedenen', indem er z. B. sowohl den Gegenstand, über den etwas ausgesagt wird, als auch den sprachlichen Ausdruck, der diesen Gegenstand bezeichnet, als Subjekt bezeichnet. Entsprechend bei " Ausgesagtes (Prädikat)", " Aussage (Copula)" usw.

	- b. Subjekt*>*finites Element*>*Objekt
	- c. Subjekt*>*finites Element*>*Objekt*>*Verb

Ob man die Stellung des Vollverbs nach dem Objekt als die 'natürliche' Stellung betrachtet oder nicht, ist für unseren Zusammenhang weitgehend unwichtig. Wesentlich ist die Erkenntnis, daß die einschlägigen Wortstellungsregularitäten nicht auf der Unterscheidung " Vollverb vs. Hilfsverb" beruhen, wie Greenberg suggeriert, sondern auf der Unterscheidung " finites vs. infinites Verb". So – und mir scheint: nur so – kann man begreifen, wie Sprecher des Deutschen zu ihren Urteilen über Beispiele wie (21), (22), (27)–(30) kommen.

Wenn wir nun alle finiten Verben durch " <sup>f</sup>V" und alle infiniten Verben durch " <sup>i</sup>V" symbolisieren (unabhängig davon, ob sie Voll- oder Hilfsverben sind) und unsere Beobachtungen über das Vorkommen von mehreren Hilfsverben in (29)/ (30) berücksichtigen, können wir die dominante Wortstellung wie in (34) kennzeichnen:

(34) S*>*fV*>*O*>*( <sup>i</sup>V)⌢( <sup>i</sup>V)

Daß nach der Objektposition zweimal " <sup>i</sup>V" in Klammern steht, bedeutet, daß ein Deklarativsatz entweder ohne ein infinites Verb auftritt oder mit 1 <sup>i</sup>V oder mit 2 <sup>i</sup>V. Dies trägt den bisher betrachteten Beispielen Rechnung, ist aber überraschend: Warum sollten es grade maximal 2 infinite Verben sein, warum nicht mehr? Tatsächlich findet man Beispiele mit 3 <sup>i</sup>V:

	- b. Karl möchte Herrn Niemöller gekannt haben dürfen
	- c. Karl scheint herangebraust gekommen zu sein

Auch 4 <sup>i</sup>V können auftreten:

	- b. Karl hätte befördert worden sein können

Die Kombinationsmöglichkeiten sind keineswegs völlig frei. Aber es scheint, daß das nicht an allgemeinen Baugesetzen des Satzes liegt, sondern an Eigenschaften der jeweils beteiligten Hilfsverben; je nachdem, welche Hilfsverben in welcher Reihenfolge kombiniert werden, ist das Ergebnis besser oder schlechter. Dies legt die Vermutung nahe, daß die Zahl der <sup>i</sup>V im Grundsatz nicht beschränkt ist und tatsächlich auftretende Beschränkungen als Ausfluß von lexikalischen Eigenschaften der Verben zu verstehen sind.

Wenn wir dies voraussetzen, können wir (34) als (37) neu formulieren:

1 Topologische Felder

(37) S*>*fV*>*O*>*( <sup>i</sup>V\*)

( " A\*" bedeutet: eine Folge von *n* Elementen A, *n>*0.) Dies ist eine erste Korrektur an Greenbergs Behauptung, das Deutsche habe S*>*V*>*O als dominante Wortstellung.

**3.1.3** Der in (37) niedergelegten Theorie scheint sich ein Bedenken entgegenzustellen. Beispiele wie in (21) sind nach Herling radikal anders als bei Greenberg zu analysieren:

	- b. Karl brachte die Kartoffeln

Nach Greenberg haben sie die Stellung S*>*V*>*O; nach (37) haben sie die Stellung S*>*fV*>*O. Wie kann ein Sprecher den Unterschied zwischen diesen beiden Analysen wahrnehmen? Zweifellos sind ja *erblickte* und *brachte* Vollverben. Wie kann er zu dem Schluß kommen, daß für Beispiele wie in (21) die Tatsache, daß dort zwischen Subjekt und Objekt ein Vollverb steht, irrelevant ist (wenn wir voraussetzen, Greenbergs Analysekategorien für topologische Phänomene sind nicht grundsätzlich inadäquat)? Die Anwort ist einfach: Solange dem Sprecher nur Stimuli von Typ (21) zugänglich sind, kann er überhaupt nicht zu diesem Schluß gelangen. Im Deutschen werden jedoch Sätze mit Hilfsverben (temporale, modale, passivische Hilfsverben) außerordentlich häufig verwendet; es kann als sicher gelten, daß Sätze vom Typ (22) mit S*>*fV*>*O*>*iV zur normalen Stimulusmenge eines Sprachlerners gehören:<sup>9</sup>

	- b. Karl soll die Kartoffeln bringen

<sup>9</sup> Park (1981) bestreitet das: " However, three German-speaking children […] also preferred the verb-final position to the medial one, although one mother never, and the other two mothers only exceptionally, produced some embedded and modal sentences" (S. 33). Diese Mütter dürften zu den ersten gehören, denen es gelungen ist, im kontinuierlichen Umgang mit Kindern Ausdrücke wie *du kannst, du darfst, du sollst (nicht) …* konsequent zu vermeiden. Die Annahme, daß die Kinder keine Stimuli der Form S*>*Aux*>*(O)*>*V kennengelernt haben, verlangt jedoch nicht nur die Annahme, daß die Mütter sich immer so verhalten haben, wie sie sich unter Parks Beobachtung verhalten haben, sondern darüber hinaus die Annahme, daß die Kinder ausschließlich solche Äußerungen als Stimuli auffassen, die von ihren Müttern (und niemand sonst) an sie (und an niemand sonst) gerichtet werden, und daß die Mütter keinerlei nichtmodale – auch keine temporalen – Hilfsverben verwendeten (obwohl Park bei einer anderen Mutter äußerst häufigen Gebrauch des Perfekts beobachtet hat (1981: 86)). Ich sehe keinen Grund, auch nur eine dieser Annahmen für glaubhaft zu halten.

Wenn ein Sprachlerner derartige Sätze überhaupt versteht, versteht er sie, indem er die Eigenschaften des Vollverbs (in ihren wesentlichen Zügen) richtig analysiert. Dabei muß man nicht die unplausible Annahme machen, daß verschiedene Kasusformen und ihre syntaktischen Funktionen richtig erkannt werden; im typischen Fall reichen Verbsemantik und situative Indizien aus, ein beträchtliches Maß an Verständigung zu bewirken (und wenn solche Indizien nicht vorliegen, ist das korrekte Verständnis der Sätze gewöhnlich auch nicht gesichert). In der Tat werden solche Sätze verstanden, und in einem Stadium, in dem die Kinder den Gebrauch von finiten und infiniten Verben nicht korrekt beherrschen, produzieren sie – neben Äußerungen vom Typ (S)*>*V*>*O – typischerweise solche vom Typ (S)*>*O*>*V. Dies ist aufgrund von Sätzen wie (21) und (22) zu erwarten; Englisch lernende Kinder produzieren dagegen nur ganz ausnahmsweise solche Wortstellungen. (Zu einschlägigem Material vgl. Park (1981) und dort angegebene Literatur.)

Sobald ein Sprachlerner Hilfsverben und finite Verben analytisch identifiziert, ist er zugleich im Stande, für Beispiele vom Typ (22) eine Analyse gemäß (37) durchzuführen. Spätestens in diesem Stadium ist es möglich, Beispiele vom Typ (21) ebenfalls gemäß (37) zu analysieren.

Man kann und muß annehmen, daß der Sprachlerner auch aufgrund weiterer Indizien in der Stimulusmenge zu einer Analyse mit <sup>f</sup>V statt V in zweiter Position geleitet wird; darauf kommen wir im folgenden Abschnitt zu sprechen.<sup>10</sup>

### **3.2 Subjekt und Objekt**

**3.2.1** Nach (37) weisen die Beispiele in (21) die Wortstellung S*>*fV*>*O auf. Wir finden aber auch Beispiele wie (38):

	- b. vielleicht bringt Karl die Kartoffeln

<sup>10</sup>Ähnliches gilt für keltische Sprachen. Beobachtungen und Erwägungen parallel zu denen, die wir für das Deutsche angestellt haben, führen zu der Annahme, daß das Kymrische und das Irische (in uneingebetteten und in eingebetteten Sätzen) nach dem topologischen Schema <sup>f</sup>V*>*(S)*>*( <sup>i</sup>V) aufgebaut sind (also nicht, wie allgemein angenommen wird, V*>*S*>*O-Sprachen im Sinne von Greenberg sind); dabei hat offenbar das Kymrische S*>* <sup>i</sup>V*>*O (vgl. Jones & Thomas 1977), während das Irische zumindest in nördlichen Varianten S*>*O*>* <sup>i</sup>V hat (vgl. Material in McCloskey (1980)). Wenn ein Satz kein Hilfsverb enthält, ist <sup>f</sup>V ein Vollverb. Die Tatsache, daß die Position am Satzanfang nicht wesentlich eine V-Position ist, ist für den Sprecher jedoch leicht zu erschließen, da diese Sprachen sehr reichen Gebrauch von sog. verb nouns machen, in denen das Vollverb in einer infiniten Form auftritt.

1 Topologische Felder

Nichts spricht dafür, dies nicht für eine dominante Wortstellung zu halten; die Sätze sind jedenfalls stilistisch neutral und intuitiv völlig normal. Nach Greenberg hätten sie die Stellung V*>*S*>*O; korrigiert und expliziter notieren wir das als (39):

(39) Adverbial*>*fV*>*S*>*O

Hier ist eine ähnliche Schwierigkeit wie bei den Hilfsverben: Nach Greenbergs Charakterisierung des Deutschen steht das Subjekt mal vor dem Verb, mal danach. Gleichwohl ist die Wortstellung nicht frei ('labile'). Offenbar herrschen strenge Beschränkungen, denn Beispiele wie (40), die nach Greenberg S*>*V*>*O-Stellung aufweisen, werden von Sprechern des Deutschen als abweichend empfunden,<sup>11</sup> und V*>*S*>*O-Sätze wie (41) sind keine Deklarativsätze:<sup>12</sup>

	- b. vielleicht Karl bringt die Kartoffeln
	- b. brachte Karl vielleicht die Kartoffeln

The discontinuity of the predicate, which commonly appears in such instances (e.g., German, 'Gestern ist mein Vater nach Berlin gefahren'), illustrates a further principle." (Greenberg 1963 [1966]: 103f)

<sup>11</sup>Greenberg hat die Voranstellung von Adverbialen wie auch das Vorkommen von Aux*>*S*>*V bemerkt, aber was er dazu schreibt, ist unverständlich:

<sup>&</sup>quot; In general the initial position is the emphatic one, and while there are other methods of emphasis (e.g., stress), the initial position always seems to be left free so that an element to which attention is directed may come first. […] It seems probable that in all languages expressions of time and place may appear in the initial positions in the sentence.

Durch " in such instances" wird dieses deutsche Beispiel mit einer in allen Sprachen möglichen Voranstellung von temporalen Adverbialen verknüpft. Aber die 'Diskontinuität des Prädikats' (*ist … gefahren*) hat nichts mit dem Adverbial zu tun: Wir haben auch *mein Vater ist (gestern) nach Berlin gefahren* ohne voranstehendes Adverb, aber mit Diskontinuität (vgl. (22a)); und wir haben (38) mit voranstehendem Adverb, aber ohne Diskontinuität. Es ist auch keiner dieser Sätze notwendig mit irgendeiner Art von Emphase verbunden.

In (38) herrscht zudem, wie wir gesehen haben, V*>*S*>*O-Stellung; etwas, was es in Sprachen mit zweifelsfreier dominanter S*>*V*>*O-Stellung bei voranstehendem Adverbial sonst anscheinend nicht gibt und was im Deutschen für Fragesätze typisch sein soll; vgl. (25). Es mag sinnvoll sein, zu sagen, die Position vor dem Subjekt in *yesterday I saw him at the station* sei " left free"; aber hinsichtlich der Stellung des Verbs gilt das im Deutschen offensichtlich nicht, wie man an (40) sieht.

<sup>12</sup>Aber es gibt Deklarativsätze von dieser Form, vgl. X [s. Anm. S. 4].

Unter Greenbergs Analyse erscheint das erneut als chaotisch.<sup>13</sup> Der Sprecher des Deutschen ist über solche Beispiele jedoch nie instruiert worden, und wenn er ein Urteil darüber fällt, muß er das aufgrund spezifischer Regeln tun. Eine Analyse, nach der die Verhältnisse in (21), (38), (40), (41) chaotisch erscheinen, muß deshalb falsch sein. Wenn man die Sätze in (21) mit Greenberg als S*>*V*>*O-Stellungen und die in (38) als V*>*S*>*O-Stellungen zu begreifen versucht und gleichzeitig unterstellt, daß die Position von V (dem Hauptverb) ein Parameter ist, der zur Charakterisierung von Deklarativsätzen wesentlich beiträgt, wäre nicht recht vorstellbar, wie (a) ein Sprecher zu Urteilen über unakzeptable Wortstellungen kommen könnte, und worin (b) die charakterisierende Leistung von Vollverben bestehen sollte.

Da wir aber schon gesehen haben, daß in (21) nicht S*>*V*>*O-Stellung, sondern S*>*fV*>*O-Stellung vorliegt, gibt es zur Verblüffung gar keinen Anlaß. Es spricht nichts dafür, daß der Position von <sup>f</sup>V – dem Träger der Kategorie Finit – relativ zum Subjekt allgemein besondere Relevanz zukommt; Greenberg behauptet jedenfalls nichts dergleichen.<sup>14</sup> Es ist daher gar nicht erstaunlich, daß wir nebeneinander S*>*fV*>*O und Adverbial*>*fV*>*S*>*O finden. Die naheliegende Interpretation ist, daß in Sätzen dieser Art (a) <sup>f</sup>V allgemein die zweite Position im Satz einnimmt und (b) das Element in der ersten Position hinsichtlich seiner syntaktischen Funktion im Satz frei ist: Es kann – mindestens – ein adverbialer Ausdruck oder ein Subjekt sein. Wir kommen also zu dem Schluß, daß die dominante Wortstellung durch ein Schema wie (42) zu kennzeichnen ist; dabei symbolisiert " *K*" die funktional unbestimmte erste Position:

(42) *K* ⌢fV*>*(S)*>*O*>*( <sup>i</sup>V\*)

<sup>13</sup>Auch solche Fälle haben anscheinend zu der Ansicht beigetragen, das Deutsche sei ein unzivilisiertes Idiom. Das Unverständnis für die Stellung Adverbial*>* <sup>f</sup>V*>*S*>*O wird weiter dadurch vermehrt, daß bei Sprechern von S*>*V*>*O-Sprachen die Meinung vorzuherrschen scheint, jedes Nicht-Subjekt am Anfang eines Satzes müsse 'emphatisch' sein; vgl. das Greenberg-Zitat in Fn.11. (Allerdings findet sich dasselbe Fehlurteil auch bei Kennern des Deutschen, z. B. Adelung (1782: 561).)

<sup>14</sup>Er sagt nur über finite Hilfsverben etwas: In Sprachen, die zweifelsfrei dominante S*>*O*>*V-Stellung haben, stehen sie nach dem V (Greenberg 1963 [1966]: 84). – Herling nimmt an, daß <sup>f</sup>V (die 'Aussage') naturnotwendig zwischen Subjekt und Prädikat stehen muß; vgl. (31a). Diese Annahme zwingt zur Aufstellung einer komplizierten und schwer überprüfbaren Theorie von " Inversionen" für Fälle wie in (38) und führt zu Schwierigkeiten bei Sätzen mit Endstellung des <sup>f</sup>V (z. B. *daß der Hund einen Hasen erblickte …*). Herling deutet das so, daß Nebensätze nicht den Charakter von Sätzen, sondern den von Begriffen haben und mit Nominalisierungen zu vergleichen sind; darum soll das, was im Hauptsatz Subjekt ist, bei ihnen dann die Funktion einer äußeren 'Nebenbestimmung' des (quasi-nominalisierten) Prädikats haben (1821b: 319ff; 1830: 89f). Die Bedenken gegen diese Theorie liegen auf der Hand.

### 1 Topologische Felder

(Man beachte: Wir betrachten nach wie vor nur Sätze, die Subjekt und Objekt enthalten. Daß " S" in (42) eingeklammert ist, bedeutet hier also: In dieser Position kann ein Subjekt stehen; wenn es dort nicht steht, kann es nur in der ersten Position *K* stehen.) Dies ist eine zweite Korrektur an Greenbergs Behauptung, das Deutsche habe S*>*V*>*O als dominante Wortstellung.

**3.2.2** Nach (42) haben die Sätze in (21) also nicht die Form S*>*V*>*O, sondern die Form *K* ⌢fV*>*O. Fragen wir nun wieder, was einen Sprachlerner zu dieser Analyse führen kann. Es ist wie bei unserer ersten Korrektur (37). Wenn die Stimulusmenge nur Sätze vom Typ (21) enthalten würde, müßte man erwarten, daß der Sprachlerner ein System entwickelt, das mit dem des Englischen weitgehend identisch ist. Aufgrund der Spracherwerbsdaten für das Englische muß man annehmen, daß der Sprachlerner S*>*V*>*O-Stellungen frühzeitig identifiziert, wenn diese Stellungen 'kontrastiv' (Harris, vgl. (1a)) bzw. 'grammatikalisiert' (Daneš, vgl. (2a)) – also auch stabil – sind, wie es im Englischen der Fall ist; Englisch lernende Kinder produzieren praktisch keine anderen Wortfolgen als (S)*>*(V)*>*(O). Aber im Deutschen werden Sätze wie (38) häufig verwendet (und außerdem Sätze von einem verwandten Typ, den wir in X [s. Anm. S. 4] besprechen) und gehören zur normalen Stimulusmenge jedes Sprachlerners. Sofern Äußerungen dieses Typs überhaupt verstanden werden und die Position des Verbs relativ zum Subjekt wahrgenommen wird, erzwingen sie die Folgerung, daß die Position von V gegenüber S im Deutschen nicht stabil, mithin auch nicht 'kontrastiv' bzw. 'grammatikalisiert' ist. Tatsächlich werden solche Äußerungen ohne Probleme verstanden; und Deutsch lernende Kinder produzieren u. a. deklarative Äußerungen mit V*>*S*>*(O)-Stellung, wie man es aufgrund von Sätzen wie (38) erwartet.<sup>15</sup> Es gibt deshalb keinen Grund, anzunehmen, daß der Sprachlerner jemals die Stellung von V (dem Vollverb) relativ zu S als relevant interpretiert; sobald finite Verben als solche identifiziert werden, ist daher – unabhängig von der Identifizierung der Hilfsverben) – die Analyse *K* ⌢fV*>*(S)*>*O möglich.

Der Sprachlerner verfügt also über mindestens zwei verschiedene Arten von Evidenz, die ihn dahin führen, die beiden ersten Positionen von Deklarativsätzen nicht als S*>*V, sondern als *K* ⌢fV zu analysieren. Aus Sätzen wie (21) einerseits und wie (38) mit voranstehendem Adverbiale o. ä. andererseits muß er schließen,

<sup>15</sup>Park (1981) meint, daß V*>*S*>*O-Stellungen – also deklarative Sätze wie (38) – im Deutschen ungrammatisch sind. Da er außerdem glaubt, daß S*>*O*>*V-Stellungen in der Stimulusmenge der Sprachlerner nicht vorkommen, aber u. a. V*>*S*>*(O)- und (S)*>*O*>*V-Stellungen bei Kindern beobachtet, sieht er sich zu einer Spracherwerbstheorie veranlaßt, die in wesentlichen Teilen unverständlich und/oder inkonsistent ist. (Gleiche Kritik hat Klein (1974) – aufgrund gleicher Überlegungen und Beobachtungen an niederländischem Material – an Park geübt.)

daß (i) vor dem (finiten) Verb eine Position ist, die funktional unbestimmt ist, und daß (ii) die Stellung von V zu S irrelevant ist (S steht nicht immer vor V). Aus Sätzen wie (22) mit Hilfsverb muß er den parallelen Schluß ziehen, daß (i) die Stellung von V zu O irrelevant ist (V steht nicht immer vor O) und daß (ii) V nicht an die zweite Position im Satz gebunden ist. Sobald Finitheit als Kategorie analytisch verfügbar ist, muß dies zur Analyse (42) führen.<sup>16</sup>

**3.2.3** Fassen wir kurz zusammen. Wenn, gemäß Greenberg, die Kategorie Vollverb für die topologischen Beziehungen in Deklarativsätzen relevant wäre, würde sich ein wildes Chaos ergeben. Wir hätten S*>*O*>*V: *Karl hat die Kartoffeln gebracht*, *vielleicht hat Karl die Kartoffeln gebracht*; S*>*V*>*O: *Karl brachte die Kartoffeln*; V*>*S*>*O: *vielleicht brachte Karl die Kartoffeln*. Für den Sprecher des Deutschen herrscht hier jedoch Ordnung: Er hat ein klares Urteil über Beispiele, über die er nie instruiert worden ist, und beurteilt gewisse Fälle als strikt abweichend, d. h. er verfährt nach 'starken Regeln' (genauer: nach 'concomitant rules', vgl. (2b)) im Sinne von Daneš. Das Schema (42) ist eine Repräsentation dieses Regelwissens.

Dieses Schema bewährt sich bei Beispielen wie (43), wenn wir von der Spezifikation von O in (42) absehen:

	- b. mich hat ein Hund gebissen

Die Sätze haben die Folge O*>*V*>*S bzw. O*>*S*>*V, sind ansonsten aber gemäß (42) aufgebaut, und Stellungsvarianten von (43), die nicht im Einklang mit (42) stehen, sind keine deklarativen Sätze oder unakzeptabel. Dabei könnte (43b) eine dominante (stilistisch neutrale) Stellung sein; der Satz muß, wenn *Hund* betont ist, nicht irgendwie 'emphatisch' verstanden werden. Für (43a) gibt es dagegen gute Gründe, diese Stellung nicht als neutral zu betrachten; vgl. X [s. Anm. S. 4]. Das ist sehr beachtlich, denn aufgrund allgemeiner Erfahrung ist man darauf gefaßt, bei nicht-neutralen Sätzen Abweichungen von der dominanten Wortstellung zu finden; so etwa im englischen Gegenstück zu (43a) mit O*>*S*>*V-Stellung:

<sup>16</sup>Aufgrund gleicher Erwägungen wie im Deutschen muß man für das Norwegische in uneingebetteten Deklarativsätzen und in einem Teil von konjunktional eingebetteten Sätzen das topologische Schema *K* ⌢<sup>f</sup>V *>*(S)*>*( <sup>i</sup>V)*>*(O) annehmen. Andere Konjunktionalsätze folgen dem Schema S*>* <sup>f</sup>V*>*( <sup>i</sup>V)*>*O. (Zum Material vgl. z. B. Faarlund (1981).) Im Schwedischen sind die Verhältnisse ganz ähnlich (vgl. Andersson 1975); ebenso im Dänischen. Auch für das Isländische dürfte das gleiche Schema gelten (vgl. Maling & Zaenen 1978; 1981); die Interpretation der Fakten wird allerdings durch gewisse Nachstellungen des Subjekts erschwert; vgl. Maling (1980).

1 Topologische Felder

### (44) topicalization I never use<sup>17</sup>

Nicht-neutrale Stellungen folgen im Deutschen also demselben topologischen Schema wie neutrale Stellungen. (42) hat mit der Charakterisierung von dominanten (stilistisch neutralen) Wortstellungen relativ zu 'markierten', 'nicht-neutralen' Stellungen gar nicht direkt zu tun.

Dies ist eine folgenreiche Einsicht. Greenberg ist im Recht, wenn er meint, daß S*>*V*>*O (jedenfalls in zahlreichen Einzelfällen) eine stilistisch neutrale (dominante) Stellung ist. Diese Charakterisierung ist ihrem Begriff nach – in den Fällen, wo es " several variant orders" entsprechend (7b) gibt – Ausdruck einer schwachen Regel. Über die im Deutschen wirksamen starken Regeln sagt diese Beobachtung überhaupt nichts. Zweifellos gibt es Interaktionen zwischen starken und schwachen Regeln, schon deshalb, weil schwache Regeln definitionsgemäß nur innerhalb des Freiraums operieren können, den ihnen die starken Regeln lassen. Aber man kann aus der Beobachtung einer schwachen Regularität (wie der Tatsache, daß S*>*V*>*O oft stilistisch neutral ist) allenfalls sehr indirekt und unter Voraussetzung vieler hochtheoretischer Annahmen Schlüsse über starke Regeln ziehen. (42) drückt hinsichtlich der Beziehungen zwischen *K*, <sup>f</sup>V und <sup>i</sup>V eine starke Regel (oder: den Effekt von starken Regeln) aus. Eine Reihe von Realisierungen dieses Schemas (mit V*>*S*>*O, S*>*V*>*O, S*>*O*>*V, oder auch O*>*S*>*V) sind stilistisch neutral, andere sind es nicht. Dies muß auf die Wirkung von schwachen Regeln zurückgehen.

**3.2.4** Greenberg beschränkt sich für seine typologischen Zwecke weitgehend auf die Betrachtung von Sätzen, die Subjekt und Objekt enthalten. Wie sind Sätze aufgebaut, die kein Objekt enthalten? Die minimale Annahme ist, daß sie sich von Sätzen mit Objekt nur durch die Abwesenheit des Objekts (und durch das Vorkommen anderer Prädikate) unterscheiden; dies scheint im Deutschen der Fall zu sein. Sie folgen dem Schema (42), wenn wir das " O" in (42) als nicht-obligatorisch betrachten. (Dies haben wir bereits bei Fällen wie (43) getan.) Unter das derart verallgemeinerte Schema (45) fällt z. B. auch Greenbergs Beispiel (Fn.11) *gestern ist mein Vater nach Berlin gefahren*:

### (45) *K* ⌢fV*>*(S)*>*(O)*>*( <sup>i</sup>V\*)

Es gibt im Deutschen Prädikate, die (fakultativ oder obligatorisch) ohne Subjekt vorkommen. Im Aktiv ist ihre Anzahl beschränkt (*jemandem wird schlecht, jemandem graust vor etwas, jemandem liegt (sehr) an etwas* und einige andere), aber

<sup>17</sup>Dieses Beispiel verdanke ich Craig Thiersch. Dem Gerücht nach ist es eine spontane und unironische Äußerung eines Sprachwissenschaftlers.

es gibt viele Fälle im Passiv (*jemandem wird geholfen, jemandem ist zu trauen, irgendwo wird gearbeitet, einer Sache läßt sich abhelfen* usw.). Die minimale Annahme ist wieder, daß sie sich von Sätzen mit Subjekt nur durch die Abwesenheit des Subjekts (und durch andere Prädikate) unterscheiden; dies scheint wiederum weitestgehend der Fall zu sein. Man beachte dabei: Eine Theorie, die die topologischen Eigenschaften von Verben wesentlich in Hinsicht auf das Subjekt beschreibt, kann solche subjektlosen Sätze überhaupt nicht erfassen. Insofern ist es relevant, daß sie alle dem Schema (45) folgen.

In (45) ist für dominante Wortstellungen die Folge S*>*O angegeben. Aber auch die Folge O*>*S scheint in manchen Fällen stilistisch neutral zu sein; etwa in (46):

	- b. leider ist dem Meister der Lehrvertrag eingefallen

Jedenfalls sehe ich nicht, daß solche Sätze notwendig irgendwie nicht-neutral sein müssen. Dies sind keine vereinzelten Beispiele; für eine ganze Reihe von Prädikaten gilt, daß die Stellung <sup>f</sup>V*>*O*>*S nicht generell als stilistisch 'markiert' empfunden wird. Naturgemäß erhebt sich spätestens hier das Bedürfnis, die Begriffe 'stilistisch neutral (normal)' und 'dominant' präzise zu explizieren, damit man sich über derartige intuitive Beurteilungen in kontrollierter Weise verständigen kann. Dieser Aufgabe wenden wir uns in X [s. Anm. S. 4] zu. Man kann aber schon hier mit Gewißheit voraussetzen: Ob eine bestimmte Wortstellung als stilistisch neutral empfunden wird oder nicht, hängt nicht allein von der syntaktischen Funktion der beteiligten Elemente ab, sondern in hohem Maße auch von – vermutlich semantischen – Eigenschaften des jeweiligen Prädikats.

Das bedeutet, daß es kein allgemeines syntaktisches Schema gibt, das ausschließlich stilistisch neutrale Stellungen erfaßt. Wenn wir nach einem allgemeinen topologischen Schema für Deklarativsätze des Deutschen suchen, können Subjekt und Objekt darin also aus mehreren Gründen nicht auftreten: Es gibt Sätze, die kein Subjekt, kein Objekt, oder weder Subjekt noch Objekt enthalten; Subjekt wie Objekt (und andere Satzbestandteile, etwa adverbiale Ausdrücke) können vor oder nach dem finiten Verb auftreten; selbst wenn Subjekt und Objekt beide nach dem finiten Verb stehen, kann man ihre stilistisch neutrale Abfolge nicht allgemein, sondern nur im Verhältnis zu bestimmten Prädikatstypen bestimmen. Das allgemeine topologische Schema für Deklarativsätze muß deshalb auf die Angabe von Subjekt und Objekt verzichten.

Diese Überlegungen führen uns zu der Formulierung (47):

(47) *K* ⌢fV *>*( <sup>i</sup>V\*)

1 Topologische Felder

Damit stärker ins Auge fällt, daß zwischen <sup>f</sup>V und den – fakultativen – <sup>i</sup>V beliebig viele (auch null) Elemente von beliebiger Art stehen können, will ich in diesem Bereich ein Zeichen " *KM*" verwenden und (47) durch (48) ersetzen:

(48) *K* ⌢fV*>*(*KM*\*)*>*( <sup>i</sup>V\*)

Dies ist – im wesentlichen; einige Präzisierungen tragen wir später nach – das allgemeine topologische Schema für Deklarativsätze.

### **4 Interrogativsätze**

**4.1** Wir haben in (25) schon kurz zwei Typen von Fragesätzen des Deutschen berührt und gesehen, wie Greenberg sie analysiert: Ergänzungsfragen wie *wen sah er?* haben O*>*V*>*S-Stellung, Entscheidungsfragen wie *kommt er?* haben V*>*S-Stellung. Unsere bisherigen Überlegungen haben uns gezeigt, daß die topologische Beziehung zwischen V (dem Vollverb), S und O irrelevant ist und daß es auf die Beziehung zwischen <sup>f</sup>V, <sup>i</sup>V und Elementen beliebiger anderer Art ankommt. Es wäre ganz überraschend, wenn Fragesätze sich da anders verhalten würden. Tatsächlich finden wir Ergänzungsfragen wie (49):

	- b. wem liegt an ihrem Erfolg?
	- c. wieso sollte den Wählern diese Politik gefallen haben?
	- d. wer hat den Mißerfolg zu verantworten?
	- e. wo wird gearbeitet?

Satz (49a) hat O*>*S*>*V-Stellung, (49b) enthält kein Subjekt und hat O*>*V-Stellung, (49c) hat O*>*S*>*V-Stellung, (49d) hat S*>*O*>*V-Stellung, und (49e) enthält weder ein Subjekt noch ein Objekt – das bekannte verwirrende Bild, das sich unter Greenbergs Analyse ergibt und das in genau derselben Form schon bei Deklarativsätzen zu beobachten war. Man sieht sofort, daß alle Sätze in (49) dem Schema (48) genügen. Ergänzungsfragesätze unterscheiden sich von Deklarativsätzen topologisch allein dadurch, daß sie in der Position *K* ein Element haben, das ein Interrogativpronomen enthält.

Bei Entscheidungsfragen ist das offensichtlich anders; vor dem finiten Verb steht kein Element. Ansonsten finden wir aber das vertraute Bild, daß sie keineswegs, wie Greenberg meint, durch V*>*S-Stellung charakterisiert sind:

	- b. liegt euch an ihrem Erfolg?


Vielmehr hat (50a) S*>*O*>*V-Stellung; (50b) enthält kein Subjekt und hat V*>*O-Stellung; ebenso (50c); (50d) hat O*>*S*>*V-Stellung; und (50e) enthält weder Subjekt noch Objekt. Das allgemeine topologische Schema für Entscheidungsfragen ist also (51); es unterscheidet sich von (48) nur dadurch, daß die Position *K* vor <sup>f</sup>V fehlt:

(51) <sup>f</sup>V*>*(*KM*\*)*>*( <sup>i</sup>V\*)

Sätze, die dem Schema (48) genügen, haben, so sage ich, F2-Stellung (oder sind F2-Sätze); Sätze, die dem Schema (51) genügen, haben F1-Stellung (oder sind F1- Sätze). Das " <sup>F</sup>" soll dabei gleichzeitig an " finit" und an " frontal" erinnern.

**4.2** Man kann in einem gewissen Maß auch F2-Sätze benutzen, um Fragen zu stellen, auf die man die Antwort *ja* oder *nein* erwartet; gewöhnlich sind die dann durch eine bestimmte Intonation gekennzeichnet, die auch für Fragesätze mit F1- Stellung typisch ist:

	- b. dir liegt an ihrem Erfolg?

Zwischen solchen F2-Sätzen und entsprechenden F1-Sätzen besteht intuitiv ein gewisser Unterschied, der jedoch schwer zu fassen ist und noch nie befriedigend expliziert worden ist. (Z. B. dienen Beispiele wie (52) keineswegs immer als 'Echo-Fragen' – was immer mit diesem Ausdruck gemeint ist.) Man könnte vermuten, daß F1-Sätze und F2-Sätze einfach freie Varianten voneinander sind. Das ist jedoch nicht der Fall.

Wir haben schon bei (41) bemerkt, daß F1-Sätze gewöhnlich nicht als Deklarativsätze verwendet werden können; umgekehrt können Fragesätze mit F1-Stellung Partikeln wie *etwa* und *denn* enthalten, die in entsprechenden F2-Sätzen nicht vorkommen können:

	- b. liegt dir denn an ihrem Erfolg?
	- b. \* dir liegt denn an ihrem Erfolg?

1 Topologische Felder

Um den Unterschied zwischen (52) und (53) terminologisch zu erfassen, bezeichne ich Sätze wie (53) – die F1-Stellung haben – als direkte (Entscheidungs-) Interrogativsätze. Sätze wie (52) – die F2-Stellung haben – sind dagegen weder Interrogativsätze noch Deklarativsätze.

Eine ähnliche Unterscheidung wie zwischen (52) und (53) kann man bei Ergänzungsfragen beobachten. In Ergänzungsfragen wie (49) kann man wie bei (53) *denn* einsetzen:

	- b. wo wird denn morgen gearbeitet?

Ergänzungsfragen müssen das Interrogativpronomen nicht in der Position *K* haben; man kann sie auch wie in (56) formulieren, und dies hat einen ähnlichen Effekt wie die Fragesätze in (52):

	- b. morgen wird wo gearbeitet?

In solche Sätze kann man aber, so wie bei (54), kein *denn* einsetzen:

	- b. \* morgen wird denn wo gearbeitet?

Ein paralleller Unterschied findet sich bei Fragen mit *warum*. Wenn sich dieses Interrogativum in der Position *K* befindet, kann es unbetont sein, wie in (58a), oder man kann es stark betonen, wie in (58b):

	- b. warum hat Karl das getan?

Bei Stellung des Interrogativums nach <sup>f</sup>V sind beide Betonungsformen unakzeptabel; möglich ist diese Stellung nur mit Betonung auf der ersten Silbe von *warum*:

	- b. \* Karl hat das warum getan?
	- c. Karl hat das warum getan?

Ebenso verhalten sich *wozu*, *womit* und einige andere zweisilbige Interrogativa.

Diese Unterschiede zwischen (55) und (56) und zwischen (58) und (59) will ich wieder so bezeichnen, daß ich Sätze wie (55) und (58) – die F2-Stellung haben und in der Position *K* ein Element haben, das ein Interrogativum enthält – als

direkte (Ergänzungs-)Interrogativsätze bezeichne. Sätze wie (56) und (59c) – die ebenfalls F2-Stellung haben, aber ein Interrogativpronomen in anderer Position enthalten – sind dagegen weder Interrogativ- noch Deklarativsätze.<sup>18</sup>

Aus diesen Beobachtungen ergeben sich zwei wichtige Folgerungen. F1-Stellung und F2-Stellung sind topologische Schemata, die sich nicht nur formal, sondern auch in ihren Gebrauchsmöglichkeiten und, im Zusammenhang damit, hinsichtlich ihrer lexikalischen Bestandteile unterscheiden können. Vgl. (53) gegenüber (54) usw. Andererseits kann ein gegebenes Schema ganz verschiedene Gebrauchsmöglichkeiten haben. So wird die F2-Stellung z. B. für Deklarativsätze wie (21) und (22) benutzt, aber auch für direkte Ergänzungs-Interrogativsätze wie in (49), (55) und (58) sowie für nicht-interrogative Fragesätze wie in (52), (56) und (59). Und eine gegebene semantische oder pragmatische Satzkategorie – etwa: Deklarativsatz oder Konditionalsatz – kann, wie wir später sehen werden [X, s. Anm. S. 4], durch ganz verschiedene topologische Schemata realisiert werden.

Besonders auffällig ist der Mangel an Übereinstimmung zwischen topologischem Schema und funktionaler Satzkategorie bei Imperativsätzen. Wir finden Beispiele wie (60):

	- b. bringt (ihr) doch den Müll auf die Straße
	- c. gib mir mal bitte einer einen Flaschenöffner
	- d. seien Sie doch nicht so stur

In Imperativsätzen hat das finite Verb im Singular eine besondere Form (*trag*, *gib*);

	- b. Karla weiß nicht, warum Karl das getan hat

Parallel zu (59c) gibt es zwar (iia), aber der indirekte Interrogativsatz in (iib) ist unakzeptabel:

	- b. Karla weiß nicht, warum Karl das getan hat

Erwartungsgemäß ist, wenn *warum* in *K* steht, die Einsetzung von *denn* schlecht oder gar nicht möglich:

(iii) \* warum hat Karl das denn getan?

Ebenso bei *wozu*, *womit* usw.

<sup>18</sup>Die Form *warum* kann in der Position *K* auftreten (*warum hat Karl das getan?*); vermutlich sollten solche Sätze aber trotzdem nicht unter 'Interrogativsätze' im intendierten Sinn fallen. Ein Grund für diese Vermutung ist, daß es zu normalen direkten Interrogativsätzen in aller Regel entsprechende indirekte Interrogativsätze gibt. So sind die Parallelen zu (58) in (i) akzeptabel:

### 1 Topologische Felder

im Plural hat es die Form des Indikativs (60b) oder des Konjunktivs (60d). Das Subjekt kann, wenn es morphologisch 2. Person ist, ausgelassen werden ((60a) und (60b)); das 'Höflichkeitspronomen' *Sie* fungiert semantisch als 2. Person Singular oder Plural, ist morphologisch aber 3. Person Plural (60d). In den Sätzen unter (60) herrscht F1-Stellung. Das ist aber kein notwendiges Charakteristikum von Imperativsätzen, denn wir finden auch Beispiele wie (61) mit F2-Stellung:

	- b. den Müll bringt gefälligst selber auf die Straße
	- c. dann gib mir mal einer einen Flaschenöffner
	- d. das nächste Mal seien Sie nicht wieder so stur

Obwohl Imperativsätze sich von Deklarativ- und von Interrogativ- bzw. Fragesätzen markant unterscheiden, können sie mit beiden topologischen Schemata vorkommen (aber nur mit diesen beiden).

### **5 Anmerkungen zur Forschungsgeschichte**

Bei unserem Bemühen, topologische Charakteristika deutscher Sätze zu finden, haben wir uns so weit wie möglich Greenbergscher Analysekategorien bedient, sind in ihrer konsequenten Anwendung aber zu völlig anderen Ergebnissen als Greenberg gelangt. Die Notwendigkeit, Greenbergs Analysen zu verwerfen, resultiert im wesentlichen aus zwei Gründen. (i) In dem Maße, wie Greenbergs Analyse sich auf Beobachtungsdaten stützen kann, sind diese Daten willkürlich beschränkt; völlig normale Daten wie (22) und (38), die jedem Sprachlerner zugänglich sind, werden ignoriert (oder in unverständlicher Weise analysiert, vgl. Fn.11). (ii) Greenbergs zentraler Begriff '(einzelsprachlich) dominant' ist – soweit er verständlich erscheint – wesentlich mit der Wirkung schwacher Regeln verknüpft. Die für Deklarativ- und Interrogativsätze des Deutschen charakteristischen topologischen Eigenschaften sind jedoch wesentlich mit der Wirkung von starken Regeln (nämlich F1-Stellung und F2-Stellung) verknüpft.

**5.1** Mängel wie bei Greenberg treten auch in der Spezialliteratur übers Deutsche selbst in jüngster Zeit immer wieder auf. Das ist einigermaßen überraschend, denn das, was (48) und (51) ausdrücken, ist spätestens seit Erdmann (1886) bekannt. Er schreibt:

(62) a. " I. Verbum an zweiter Stelle, d. h. ein Nomen vor dem Verbum, alle andern ihm folgend. […] Enthält [der einfache Aussage-

satz] nur einen nominalen Satzteil, so steht dieser (gewöhnlich also das Subjectivswort) voran, und das Verbum schliesst den Satz ab […]. Enthält der Satz aber mehrere nominale Bestandteile, so steht vor dem Verbum doch ebenfalls immer nur einer […]; alle andern folgen dem Verbum. Die Auswahl dieses einen aber ist im Deutschen völlig dem Belieben des Redenden überlassen; er stellt dasjenige Nomen voran, das ihm für den Zweck seiner Rede gerade den passendsten Ausgangspunkt bietet, um dann mit Anreihung des Verbums an dasselbe dem Satze die feste Grundlage zu geben, auf welcher der Aufbau der manigfaltigsten und zahlreichsten weiteren Bestimmungen erfolgen kann. Durchaus unrichtig ist es, wenn manche Grammatiker hier dem Subjectsnominativ besondern Anspruch auf die erste Stelle einräumen wollen; ebenso gut wie er kann jeder oblique Casus, jede adverbiale oder prädicative Bestimmung vorantreten […], und zwar sowol nachdrücklich betonte als ganz unwichtige, sowol kurze als sehr umfangreiche Bestimmungen." (Erdmann 1886: 182f)


### 1 Topologische Felder

Die 'Nomen' oder " nominalen Satzbestandteile können einzelne Worte (Casus eines Substantivs oder Pronomens und aus ihnen entstandene Adverbia […]) sein; sie können aber auch aus mehreren als grammatische Einheit dem Verbum gegenübertretenden Worten bestehn" (S. 181), entsprechen also dem *K* bzw. *KM* von (48) und (51). Was dort als infinites Verb (iV) gekennzeichnet ist, bezeichnet Erdmann als prädikativ gebrauchte Bestimmung des Verbs; unter " Verbum" versteht er allemal ein finites Verb (fV). Was in diesen Textstellen gesagt ist, ist nichts anderes als eine verbale Fassung von (48) – F2-Stellung, Erdmanns Typ I – und von (51) – F1-Stellung, Erdmanns Typ II.

**5.2** Viele inhaltliche Einzelheiten aus diesen Zitaten und den hier nicht zitierten näheren Ausführungen dazu finden sich in ähnlicher Form in zeitgenössischen Werken (z. B. bei Sanders (1883)), bei Herling (1821b; 1828; 1830) oder schon bei Adelung (1782). Dieser stimmt mit Erdmann besonders darin überein, daß er die zweite Position in einem Deklarativsatz dem 'eigentlichen Verb' (d. h. dem finiten Verb) vorbehält und infinite Verben als Bestimmungen des eigentlichen Verbs ansieht:

(63) " §780. Eben dasselbe gilt auch von den so genannten zusammen gesetzten Zeiten, wo die Stellung des Participii nach dem Hülfsworte keine Ausnahme von der Regel machen kann, so bald man nur einiger Maßen deutliche Begriffe von einem Verbo finito und von einem Participio hat. Allein, da sich Sprachlehrer unter allen Geschöpfen Gottes bisher am wenigsten um klare und deutliche Begriffe bekümmert haben, so haben sie auch hier die Sachen ganz verkehrt angesehen, und das Participium für das eigentliche Verbum, das Hülfswort aber, für – nun für das Hülfswort gehalten, und da wollte denn freylich die Regel, daß das Verbum finitum seine Bestimmungen nach sich nimmt, nirgends passen. Es ist sehr erbaulich zu sehen, wie sie sich theils winden, theils auf gespitzten Zehen über die Sache wegeilen, wenn sie auf diesen Punct in der Wortfolge kommen. […]

Die so genannten zusammen gesetzten Zeiten der Deutschen Conjugation bestehen aus einem Verbo finito mit einem unvollständigen Prädicate […]. Wer siehet nun nicht, daß dieses Hülfswort hier das eigentliche Verbum finitum ist, indem alle Veränderungen der Person und Zahl an demselben allein vorgehen, dagegen das Participium, ob es gleich den Hauptbegriff enthält, in allen Fällen unverändert bleibt, und folglich weiter nichts, als ein von dem Verbo abgeleitetes Adverbium oder Beschaffenheitswort ist" (Adelung 1782: 525f)

Wesentliche Fakten, um die es uns bei der Auseinandersetzung mit Greenberg gegangen ist, waren also lange vor Herling bekannt. Herlings Ausführungen da-

zu in (31) sind in ihrem observationellen Gehalt nicht neu, unterscheiden sich von früheren (und vielen späteren) Darstellungen jedoch durch die Luzidität und Prägnanz in der Analyse der systematischen Zusammenhänge. Dabei war Herling zu seiner Zeit in erster Linie für seine Lehre komplexer Sätze bekannt, die er in (1821b) skizziert und in (1823; 1827; 1832) und (1828) ausführlich entwickelt hat. (Ein weiterer Interessenschwerpunkt war die Lehre von Tempus und Modus: Herling (1821a; 1837; 1840).) Seine Verbstellungslehre hat nicht überall sofort Aufmerksamkeit gefunden. So hatte Becker im *Organism* (1827: 319f) noch eine viel weniger durchsichtige und in mancher Hinsicht zweifelhafte Darstellung gegeben. Erst in der *Grammatik* von <sup>1829</sup> (die " seinem verehrten Freunde" Herling gewidmet ist) hat er Herlings Analyse übernommen. Dabei verschärft er Herlings Deutung, die Position des Verbs am Satzende sei die " ursprüngliche Stelle" (vgl. 31c), in interessanter Weise:

(64) " wir unterscheiden demnach in der Topik des prädikativen Satzverhältnisses drei Stellen, nämlich die des Subjektes, der Kopula und des Prädikativs z. B.


Wenn das Prädikat durch ein einfaches Verb in einer einfachen Flexionsform ausgedrückt ist; so nimmt das Verb, welches den Begriff und durch die Flexion zugleich die Beziehungen ausdrückt, immer die Stelle der Kopula ein. Wir lassen jedoch, um alle Verschiedenheit der deutschen Topik unter wenigen Gesetzen zusammenfassen zu können, auch für diesen Fall drei Stellen gelten, indem wir annehmen, daß das Verb alsdann die Stelle der Kopula einnehme, und daß auf die nicht ausgefüllte Stelle des Prädikativs andere topische Verhältnisse, wie die des objektiven Faktors, bezogen werden z. B.

```
Subjekt Kopula Prädikativ
Der Βaum blühet –
Das Kind spricht – " (Becker 1829: 378f)
```
(Ganz entsprechend Becker 1832: 210 und 1837: 310f.) In dieser Formulierung tritt womöglich noch deutlicher als bei Herling hervor, weshalb die Position des Verbs – des Vollverbs – am Satzende als sein eigentlicher systematischer Ort betrachtet wird: weil auf diese Weise gewisse topologische Eigenschaften der Satz-

### 1 Topologische Felder

bestandteile generell formuliert werden können. (Aus demselben Grund kann bei Benutzung von Greenbergschen Analysekriterien die F-Position des finiten Verbs nicht zur Charakterisierung einer basic order benutzt werden.) Beckers – bzw. Herlings – Argumentation findet sich in fast unveränderter Form dann später bei Bierwisch (1963: 35) wieder. Adelung gedachte dieselben topologischen Regularitäten generell zu formulieren, indem er die zweite Satzposition (die des finiten Verbs) als Bezugspunkt nahm. So, wie er seine Lehre formuliert, ist sie zweifellos inkonsistent; wir gehen darauf nicht näher ein.<sup>19</sup> Ob und wie weit Herlings Idee fruchtbar ist, werden wir später [in X, siehe Anm. S. 4] untersuchen.

Erdmann beschränkt sich dagegen – wie auch (48) und (51) – darauf, die durch starke Regeln fixierten Positionen des finiten Verbs (in (62a, b)) und der infiniten Verben (in 62d) festzuhalten. Dies ist vor allem im Verhältnis zu jener Arbeit bemerkenswert, über die er ausdrücklich sagt: " In den meisten Punkten stimme ich überein mit der lesenswerten Abhandlung von E. Nordmeyer […]" (Erdmann 1886: 182). Die Abweichungen bestehen vor allem in zwei wichtigen Teiltheorien: der Umschließungslehre und der Inversionslehre.

**5.3** Es ist eine Tradition deutscher Sprachliebhaber, sich von einer angeblichen Eigentümlichkeit des Deutschen beeindruckt zu zeigen, die Herling so beschreibt:

<sup>19</sup>Herlings Kritik möge als Hinweis genügen:

<sup>&</sup>quot; §12. Es scheint, als habe Adelung (Lehrgeb. B. II. §760. u. s. w.) beide entgegengesetzte Wortfolgen, nämlich der wesentlichen Theile des Hauptsatzes, so wie der Nebenbestimungen und Nebensätze, aus einem einzigen Principe erklärt, indem er festsetzt, daß das Unbestimmtere dem Bestimmteren und zwar nach dem Grade seiner Bestimmtheit vorstehe; aber bei genauerer Prüfung zeigt es sich, daß er von diesem Principe eine doppelte und zum Theil unsichere Anwendung macht. Denn in den wesentlichen Theilen des Hauptsatzes nennt er zwar das Subject bestimmt an sich, jedoch in Absicht der Rede erst zu bestimmen, und das Prädicat, welches als Bestimmung nach folgt, das Bestimmtere; die Nebenbestimmungen läßt er aber nach dem Grade ihres schwächeren Bestimmens den folgenden, welche durch sie bestimmt werden sollen, vorausgehen. Die Verschiedenheit dieser Anwendung seines Princips täuscht uns also in Ansehung der Einheit desselben. Die Rechtfertigung der topischen Stellung der Aussage (§761. Nro. 3) zeigt die Verlegenheit bei der Anwendung seines Princips noch deutlicher, und hätte er […] die Aussage von dem Ausgesagten getrennt behandelt, so würde seine Behauptung " daß das Regierende dem Regierten vorgesetzt werde, weil die Rection eine wahre Bestimmung sey" unterblieben seyn. Es ist ja auch der Unterschied der Wortfolge in beiden Fällen, indem bei den wesentlichen Theilen des Hauptsatzes die Bestimmung dem Bestimmten folgt, bei den Nebenbestimmungen aber vorhergeht, so unverkennbar und bezeichnend, daß es rathsamer ist, ihn hervorzuheben, als ihn auf jene Weise verwischen zu wollen." (Herling 1821b: 302f)

(65) " Indem […] die Nebenbestimmungen, welche bei einem Substantive zwischen die Deuter und das Substantiv selbst, bei dem Prädicate zwischen dasselbe und einen vorhergehenden Begriff z. B. die Aussage treten, mit ihrem Bestimmten schon topisch zusammengehalten, und zu Einem Begriffe verbunden, in geschlossenen Massen dargestellt werden, bröckeln solche Sprachen, die diesen Unterschied nicht kennen, in einer gleichmäßigen Wortfolge fortschreitend einen Begriff dem andern nach, und fast nirgends, als in ihren Nebensätzen, in sofern diese doch ein Ganzes ausmachen, ist eine solche Verknüpfung der Begriffe durch die Topik sichtbar." (Herling 1821b: 302)

Und er sieht eine formale Ähnlichkeit zwischen Nebensätzen und Nominalphrasen:

(66) " Der Satzartikel " daß", die relativen Conjunctionalien stehen, da sie sich auf den ganzen Satz beziehen und diesen gleichsam individualisirend einschließen, am Anfang des Satzes, wie der Artikel eines Substantivs" (Herling 1830: 89)

Der Eindruck, daß im Deutschen gewisse Satzbestandteile in spezifischer Weise " topisch zusammengehalten" werden, ist natürlich primär durch die topologische Trennung von 'Aussage' und 'Ausgesagtem' begründet (die freilich in ähnlicher Weise auch z. B. in keltischen und nordgermanischen Sprachen besteht; vgl. Fn.10 und Fn.16); die Parallelisierung mit der topologischen Beziehung zwischen Demonstrativum oder Artikel (" Deuter") und Substantiv dürfte durch den Vergleich mit dem Französischen motiviert sein. (Das Englische stimmt in dieser Hinsicht mit dem Deutschen weitgehend überein.)

Nordmeyer (1883) hat diese schon in Herlings Formulierungen zweifelhafte Lehre ins Extrem getrieben: Auch bei Nebensätzen sieht er " dasselbe Princip, welches dem Prädikat des Hauptsatzes seine Form verlieh, nämlich das der Umschließung" (S. 70), und Umschließungen erblickt er überall, das Deutsche wird von diesem Prinzip gänzlich durchwaltet. Nordmeyers Umschließungslehre findet sich später bei Drach (1937) unter der Bezeichnung " Umklammerung" fast wörtlich wieder.

Erdmann macht von dieser Umschließungslehre nur in relativ nüchterner Form Gebrauch:

(67) " Andererseits aber wird im Satztypus I und II eine vom Verbum entfernte Stelle, und zwar vorzugsweise die letzte, regelmässig gewählt für solche Bestimmungen, die mit dem Verbum finitum grammatisch oder lexicalisch eine Einheit bilden, indem sie die im Verbum enthaltene Aussage

### 1 Topologische Felder

zunächst ergänzen. Sie sind immer scharf betont; gerade dadurch, dass ihre Stellung am Schlusse mit der des Verbums am Anfange correspondiert, wird der enge Zusammenhang beider angedeutet, und indem alle anderen Satzteile (ausser dem einen nach Typus I. vorangestellten), auf welche die so ergänzte Aussage des Verbums sich bezieht, von demselben und seiner nächsten Bestimmung umschlossen werden, tritt die Einheit des Satzes anschaulich hervor." (Erdmann 1886: 191)

Der Gedanke, daß das finite Verb häufig mit einem am Satzende stehenden Element eine grammatische oder lexikalische Einheit bildet, läßt sich präzise explizieren und empirisch erhärten, vgl. X [s. Anm. S. 4].

**5.4** Erdmann weicht noch in einer zweiten wichtigen Einzelheit von Nordmeyer ab. Nordmeyer nimmt – wie fast alle älteren Autoren (z. B. Herling) und viele neuere – an, daß bei F2-Sätzen im 'Normalfall' das Subjekt die Position *K* einnimmt, daß aber ein anderer Satzbestandteil an seine Stelle treten kann. Er schreibt:

(68) " Jetzt wird es auch einleuchtend, warum das grammatische Subjekt unmittelbar hinter das Verbum tritt, sobald es von seiner Stelle vor demselben verdrängt wird" (Nordmeyer 1883: 9)

Er trifft sich hier (u. a.) mit Bierwisch (1963: 102); beide haben übersehen, daß das Subjekt in F2- (und in F1-) Sätzen weit nach dem finiten Verb kommen kann, etwa in (46) und in (69):

(69) zweifellos haben trotz der großen Wohnungsnot auch damals in Berlin und Umgebung viele Menschen eine Heimat gefunden

Herling trägt solchen Fällen durch eine sehr differenzierte Inversionslehre Rechnung, und es ist kein Zweifel, daß in einem Grammatiksystem, das keinen formalen Restriktionen unterworfen ist, derartige Umstellungen formulierbar sind. Es ist aber völlig unklar, welche Evidenz in der Stimulusmenge einen Sprachlerner zu der Annahme führen könnte, daß das Subjekt zwar in vielen verschiedenen Positionen im Satz auftreten kann, aber dennoch primär in die Position *K* vor dem finiten Verb gehört. Wir haben schon in 3.2 gesehen, daß die dem Sprachlerner zugängliche Evidenz ganz im Gegenteil darauf hindeutet, daß diese Position funktional unbestimmt ist. Selbst wenn es 'Subjektinversion' in Nordmeyers Sinn gäbe, wäre zu erwarten, daß sie spezifische formale Eigenschaften hätte. Eine naheliegende Möglichkeit wäre, daß durch die Voranstellung eines Nicht-Subjekts das Subjekt so, wie Nordmeyer und Bierwisch unterstellen, in die zweite nicht-

verbale Position des Satzes gedrängt wird; aber mit dieser Annahme sind Sätze wie (69) nicht zu erklären. Eine andere – eventuell zusätzliche – Möglichkeit wäre vielleicht, daß die vorangestellte Konstituente und das Subjekt ihren Platz vertauschen. Es ist sehr fraglich, ob solche Operationen in natürlichen Sprachen existieren können. Klare Beispiele dafür sind aus keiner Sprache bekannt. In jedem Fall taugt diese Annahme nicht zur Erklärung der Verhältnisse im Deutschen. Der Satz (69) müßte dann auf (70) zurückgehen; aber falls das Beispiel überhaupt voll akzeptabel ist, sind (69) und (70) (wegen der Skopusverhältnisse zwischen *zweifellos* und *viele Menschen*) nicht gleichbedeutend:

(70) viele Menschen haben trotz der großen Wohnungsnot auch damals in Berlin und Umgebung zweifellos eine neue Heimat gefunden

Und wenn wir bei (71a) *in die Tasche* voranstellen, müßte (71b) (oder 71c) resultieren; aber (71b) ist kaum oder gar nicht akzeptabel, und (71d) bleibt ohne Erklärung:

	- b. in die Tasche hat mir einen Zettel jemand gesteckt
	- c. in die Tasche hat jemand mir einen Zettel gesteckt
	- d. in die Tasche hat mir jemand einen Zettel gesteckt

### Vgl. auch (46).

Der Annahme einer Subjektinversion fehlt damit nicht nur jede primäre Motivation – vgl. 3.2 –; sie trägt auch absolut nichts dazu bei, die Stellungsmöglichkeiten eines Subjekts nach dem finiten Verb in F2- oder F1-Sätzen zu erfassen. Insofern verdient es Beachtung, daß Erdmann entgegen einer langen Tradition in (62a,c) nachdrücklich betont, daß das Subjekt im Allgemeinen weder auf die Position vor noch auf die Position unmittelbar nach dem finiten Verb besonderen Anspruch hat; irgendeine Art von Subjektinversion gibt es bei ihm nicht.

Daß die Stellung des Subjekts für das Verständnis der Verbstellungsregularitäten irrelevant ist, hat Erdmann erstmals in Erdmann (1881) hervorgehoben. Dort schreibt er:

(72) " einen alle sätze umfassenden einteilungsgrund, wie ihn R. offenbar sucht, bietet die stellung des verbums, das in jedem satze einmal enthalten ist, gegenüber allen von ihm abhängigen satzbestandteilen" (Erdmann 1881: 192)

In einer Fußnote fügt er hinzu: " klar und treffend ist dies ausgesprochen von Koch Deutsche grammatik<sup>3</sup> §435; Wilmanns Deutsche grammatik §209." (Erdmann 1881: 192 Fn. 1)

### 1 Topologische Felder

Ob Erdmann berechtigt ist, Wilmanns derart als Stütze für seine Ansicht zu zitieren, ist indessen fraglich. Zwar schreibt Wilmanns im angegebenen §209:

(73) " Dem Verbum finitum geht éin Satzglied voran, die übrigen, falls solche vorhanden, folgen nach." (Wilmanns 1878: 181)

Wenige Zeilen später folgt jedoch die Bemerkung: " Das Subjekt steht, wenn es nicht die Spitze des Satzes einnimmt, unmittelbar hinter dem Verbum (vgl. §74)." Und in §74 heißt es:

(74) " Alle Satzglieder, die sich zunächst dem Verbum anschliessen (Object, Subst. mit Praep., Adverbia), können auch an die Spitze des Satzes treten. […] Das Subject tritt dann im einfachen Aussagesatz hinter das Verbum finitum, in der Regel unmittelbar dahinter." (Wilmanns 1878: 42)

Es ist offensichtlich, daß Wilmanns hier eine Inversionslehre ganz im Sinne von Nordmeyer vertritt: Das Subjekt steht primär vor dem <sup>f</sup>V; aber andere Elemente können an seine Stelle rücken, und dabei tritt das Subjekt unmittelbar hinter das Verb – dieselbe falsche Behauptung wie in (68). Daß vor dem <sup>f</sup>V in jedem Fall genau 1 Element steht – worauf Erdmann in seinem Hinweis auf (73) wohl abhebt –, ist allgemein unstrittig und unterscheidet nicht zwischen seiner in (72) ausgedrückten – kritisch gegen Ries gerichteten – Ansicht und den verschiedenen Inversionslehren.

Korrekt scheint dagegen Erdmanns Hinweis auf Koch zu sein. Der schreibt im angegebenen §435 u. a.:

(75) " Im behauptenden Satze und in dem durch ein Interrogativ gebildeten Satze gilt jetzt das Gesetz: an der zweiten Stelle steht das Verb und bei zusammengesetzten Verbalformen das Hilfsverb. Jeder Satz läßt daher so viele Umstellungen zu, als er außer dem einfachen Prädikat Glieder hat:

> Sie zogen gestern lärmend an meinem Hause vorüber. Gestern zogen sie lärmend an meinem Hause vorüber. Lärmend zogen sie gestern an meinem Hause vorüber. An meinem Hause zogen sie gestern lärmend vorüber. Vorüber (an meinem Hause) zogen sie gestern lärmend."

> > (Koch 1860: 219f)

Hier ist nicht unmittelbar klar, was unter 'Umstellung' zu verstehen ist. Unter Annahme einer Subjektinversion würde man den ersten Beispielsatz als die Normalform und die folgenden 4 Beispiele als 'Umstellungen' dazu betrachten. Das würde jedoch heißen, daß der Satz (außer dem einfachen Prädikat) nur die 4 'Glieder' *gestern*, *lärmend*, *an meinem Hause* und *vorüber (an meinem Hause)* hätte.

Das kann Koch nicht meinen; das Subjekt *sie* ist mit Sicherheit ebenfalls ein 'Glied' des Satzes. Ganz allgemein: Wenn unter einer 'Umstellung' eine Alternative zu einer Normalstellung (mit Subjektinversion) zu verstehen wäre, könnte ein Satz mit *n* Gliedern nur n–1 Umstellungen zulassen. Wenn, wie Koch sagt, die Zahl der Umstellungen gleich der Zahl der Glieder ist, muß man unter 'Umstellung' hier verstehen: verschiedene Besetzungen der *K*-Position. Nach dieser Darstellung ist mithin keine der verschiedenen Besetzungen von *K* vor einer anderen grammatisch ausgezeichnet. Dies wird auch in den darauf folgenden Ausführungen klar. Es heißt z. B.:

(76) " Bei zwei Adverbialen steht das betontere nach: er spielt heute gut; bei mehreren werden sie am besten vertheilt, so daß sie theils dem Verb voranstehen, theils demselben nachfolgen." (Koch 1860: 220, §435c) " Auf diese Stellung wirkt ein a) […] – b) Der Zusammenhang, in welchem der Satz vorkömmt, indem in dem ersten Worte die Beziehung auf den vorigen Satz aufgenommen wird: So sprach er. Dieses tat er." (Koch 1860: 220, §436)

Weder hier noch an anderen Stellen ergibt sich ein Indiz für die Annahme einer Subjektinversion.

Das tritt noch deutlicher hervor, wenn man frühere Auflagen von Kochs Grammatik vergleicht.<sup>20</sup> In der 2. Auflage heißt es:

(77) " Als Hauptgrundsatz für [die Wortfolge] gilt jetzt: an der zweiten Stelle steht das (Verb) Prädikat oder, wenn ein solches da ist, sein Beziehungswort. Jeder Satz läßt daher so viele Umstellungen zu, als er außer dem Prädikate Glieder hat:

Ich habe gestern meinem Bruder einen Brief geschrieben. Gestern habe ich meinem Bruder einen Brief geschrieben. Meinem Bruder hab' ich gestern einen Brief geschrieben. Einen Brief habe ich gestern meinem Bruder geschrieben. Geschrieben habe ich gestern meinem Bruder einen Brief." (Koch 1854: 187, §392)

Inhaltlich stimmt das mit (75) überein. (Das 'Beziehungswort' ist die Kopula bei nominalen Prädikaten; mit der etwas genaueren Formulierung " einfaches Prädikat" in (75) ist offensichtlich schlechthin jedes finite Verb gemeint.) Auch für (76) gibt es entsprechende Formulierungen. In der 1. Auflage heißt es dagegen ganz anders:

<sup>20</sup>Die 4. Auflage stimmt im einschlägigen Abschnitt (1862: 239f, §425f) mit der 3. Auflage 1860 völlig überein.

### 1 Topologische Felder

(78) " In seiner Beziehung auf das Subject wird das Prädikat erst verständlich, daher steht jenes gewöhnlich voran.

Bei abweichender Wortstellung (Inversion) pflegt das Verb, mag es nun Prädikat oder Copula sein, an der zweiten Stelle zu stehen" (Koch 1848: 137f, §246)

Aus dieser äußerst knappen Wortstellungstheorie kann man zweierlei erschließen: Erstens nimmt Koch hier klar eine Subjektinversion an. Zweitens ist hier ein wesentliches Problem aller Inversionstheorien angedeutet. Wenn die Position vor dem finiten Verb primär dem Subjekt zukommt, dann wäre es naheliegend, daß ein Satzelement vor das Subjekt und das finite Verb gestellt werden kann, etwa wie in (40); und sofern eine Nachstellung des Subjekts überhaupt möglich ist, wäre es naheliegend, daß ein Deklarativsatz dann mit dem finiten Verb beginnt, etwa wie in (41). Daß diese Möglichkeiten im heutigen Deutsch nicht bestehen, muß in der Tat ausdrücklich wie in (78) hervorgehoben werden. Man kann vermuten, daß diese Überlegungen Koch veranlaßt haben, die Inversionstheorie in den späteren Auflagen fallen zu lassen.

Ganz explizit und nachdrücklich hat Gabelentz (1875) – von Erdmann offenbar übersehen – die Subjektinversionslehre für das Deutsche bestritten. Er schreibt:

	- 1) das grammatische Subjekt […] Es kann
	- 2) das direkte oder indirekte Objekt des Hauptverbums oder das verbale Objekt eines Hülfsverbums den Satz eröffnen […]
	- 3) kann ein Adverb oder dessen Aequivalent […] zu Anfange des Satzes stehen […] – Endlich
	- 4) kann das Prädicatsnomen vorantreten"

(Gabelentz 1875: 144f)

" Ich möchte den deutschen Satz einem Schranke mit drei Fächern vergleichen. Was das erste Fach enthalten kann, haben wir vorhin gesehen. Das zweite, engste, enthält ein für allemal das verbum finitum. Das dritte ist das geräumigste, denn dahinein muss Alles, was noch nicht untergebracht ist." (Gabelentz 1875: 146)

Dieses 'Grundgesetz' interagiert nach Gabelentz mit zwei weiteren Gesetzmäßigkeiten. Die erste ist (80):

(80) " dass jedes folgende Glied die vorhergehenden näher bestimmt, mit andern Worten, das Prädikat zu diesem bildet, während dieses zu jenen sich als Subjekt verhält." (Gabelentz 1875: 137)

Hier sind " Subjekt" und " Prädikat" nicht im grammatischen Sinne zu verstehen, sondern " psychologisch" gemeint. Die Gliedfolge A*>*B ist angemessen, wenn der von A bezeichnete Gegenstand

(81) " das Thema, worüber ich reden will, also mein psychologisches Subjekt bildet" (Gabelentz 1875: 137)

Die zweite Gesetzmäßigkeit ist, daß eine Wortgruppe " Nebenprädikate" in sich aufnehmen kann. Dieses Prinzip der " Infigierung" oder " Einschachtelung" ist identisch mit der " Umschließung", die wir bei Nordmeyer (1883) beobachtet haben: Durch die einleitende Konjunktion und das satzschließende Verb werden 'Nebensätze' zu einer Einheit; in derselben Weise entsteht durch das finite Verb und die Elemente am Satzende bei F-Sätzen eine Einheit. Diese Einheiten sind in sich nach dem Prinzip (80) gegliedert, fungieren aber in ihrer Gesamtheit als syntaktische Elemente. Bei F2-Sätzen bildet diese Einheit im Allgemeinen das psychologische Prädikat zu dem psychologischen Subjekt in der Position *K*; interrogative F1-Sätze ermangeln eines solchen psychologischen Subjekts. Eine Frage ist " materiell keine selbständige Rede; was Wunder also, wenn sie es auch formell nicht ist?" (Gabelentz 1875: 156).<sup>21</sup>

Die Annahme (80) ist nicht weniger zweifelhaft als die Lehre von der 'Infigierung' oder 'Umschließung'; wir gehen hier nicht darauf ein. Es ist aber deutlich, daß die Probleme der Subjektinversionstheorie einzelnen Autoren schon vor Erdmanns nachdrücklicher Stellungnahme deutlich geworden sind. Trotzdem hat die traditionelle Lehre immer wieder Anhänger gefunden. So schreibt z. B. Wunderlich in explizitem Widerspruch zu Erdmann:

(82) " Unsere eigene Darstellung hofft dieser Lösung noch näher [sc. als Erdmann 1886] zu kommen.

Die Stellung des Verbum gegen das Subjekt beherrscht unsere ganze Wortstellung und darüber hinaus noch andere syntaktische Erscheinun-

<sup>21</sup>Weil (1887 [1879]: 9) beansprucht, alle von Gabelentz (1875) aufgestellten topologischen Prinzipien schon 25 Jahre früher (in der 1. Auflage seines Buches, 1844) formuliert zu haben. Hinsichtlich des Deutschen ist das unkorrekt. Bei seinen Bemerkungen über die deutsche Topologie stützt sich Weil weitestgehend auf Herling (1830); insbesondere geht er eindeutig von einer Subjektinversion aus: " in all principal sentences the verb should be put in the midst of the sentence before the attribute and after the subject or that part of the proposition which occupies its place." (Weil 1887 [1879]: 54)

### 1 Topologische Felder

gen, wie vor allem die Gliederung des Satzgefüges in Haupt- und Nebensatz.

Wir finden nun drei Hauptformen dieser Stellung: 1. das Verbum vor dem Subjekte […]; 2. das Verbum unmittelbar hinter dem Subjekt […] und 3. das Verbum mittelbar hinter dem Subjekt" (Wunderlich 1892: 87f)

In jüngerer Zeit ist Erdmanns Erkenntnis erst wieder von Drach (1937) und dann besonders klar von Griesbach (1960; 1961) mit Nachdruck zur Geltung gebracht worden. Wenn – wie etwa bei Blümel (1914) – eine explizite Argumentation zugunsten der Inversionstheorie versucht wird, wird gewöhnlich die Relevanz der Fakten, die wir in 3.2 diskutiert haben, außer Acht gelassen, und generell wird nicht mit der gebotenen Deutlichkeit zwischen starken und schwachen Regeln unterschieden. Dem problematischen Verhältnis zwischen diesen Regeltypen wenden wir uns in X [s. Anm. S. 4] zu. Vorläufig bleiben wir dabei, die 'grammatischen' Eigenschaften der Satztypen herauszuarbeiten.

### **6 Endstellung**

Wir haben bisher, Greenberg folgend, nur uneingebettete Sätze von gewissermaßen prototypischer Art betrachtet: Deklarativsätze und Fragesätze. Es gibt jedoch weitere Arten von uneingebetteten Sätzen, und diese unterscheiden sich topologisch erheblich von den bisher behandelten:

	- b. wenn Karl doch nur endlich kommen wollte!
	- c. ob Karl ihr aber auch nicht zu viel verspricht?

Das auffälligste an solchen Beispielen ist, daß das finite Verb hier nicht in einer F1- oder F2-Stellung vorkommt, sondern am Ende des Satzes, unmittelbar nach potentiell vorkommenden infiniten Verben. Das topologische Schema kann man als (84) formulieren:

### (84) C*>*(*KM*\*)*>*( <sup>i</sup>V\*)⌢fV

In der Position C stehen in unseren Beispielen die Satzkonjunktionen *daß*, *wenn*, *ob*. Im typischen Fall sind Sätze von der Form (84) in andere Sätze eingebettet und stellen sog. Nebensätze dar; an (83) sieht man, daß das nicht notwendig so ist. (Man kann diese Beispiele auch nicht ohne weiteres etwa darauf zurückführen, daß ein Trägersatz, in den sie eingebettet waren, ausgelassen worden wäre: Die Elemente *aber auch* und *doch nur* kommen in eingebetteten Sätzen nicht mit gleicher semantischer Funktion vor.)

Uneingebettet treten auch infinite Konstruktionen wie (85) auf:

	- b. wegen so einer Kleinigkeit so einen Wirbel zu machen!

Solche Konstruktionen findet man auch eingebettet als sog. satzwertige Infinitivkonstruktionen wie in (86):

	- b. es war dumm von Karl, wegen so einer Kleinigkeit so einen Wirbel zu machen

Manche Eigenschaften dieser Konstruktionen sprechen dafür, daß dies tatsächlich Sätze sind.<sup>22</sup> Sie kommen auch mit Elementen wie *um* vor, die man als Satzkonjunktionen betrachten kann:

(87) um nicht gesehen zu werden, benutzte Karl den Hinterausgang

Wir können solche Konstruktionen zwanglos als Manifestationen des in (83) exemplifizierten Typs verstehen, wenn wir (84) durch (88) ersetzen:

(88) (C)*>*(*KM*\*)*>*( <sup>i</sup>V\*)⌢uV

Dabei steht " <sup>u</sup>V" für " unabhängiges Verb": Nach den Vorschlägen von Höhle (1978) selegiert ein Hilfsverb ein Verb in einer bestimmten infiniten Form; das

<sup>22</sup>Aber nicht jede Konstruktion, die einen Infinitiv mit *zu* enthält, ist satzwertig; z. B. nicht bei *schein-* (vgl. (92b)). Verben, die mit nicht-satzwertigen Infinitkonstruktionen vorkommen, werden traditionell meist als Hilfsverben bezeichnet. Herling (1828) schreibt dazu:

<sup>&</sup>quot; Es hängt auch hier von der Bedeutung des Wortes ab, ob es wirkliches Verb oder Hülfsverb ist. So sind wird und weiß in: " er wird sich mit seinen Anlagen schon aus der Verlegenheit helfen" und " er weiß sich mit seinem Einflusse schon Ersatz zu verschaffen", wie pflegt in: " er pflegte sich in ähnlichen Fällen besser zu benehmen" bloße Hülfsverben und ihre Infinitive haben nicht den Character des Satzes; aber in: " er wird erst, was ich schon bin" und " er weiß, daß er sich helfen kann", verschieden von " er weiß sich zu helfen", sind es beide wirkliche Verben. [127.]" (Herling 1828: 206)

Dazu die Anm.: " 127) Wie pflegen und gewohnt seyn darin sehr verschieden sind, daß letzteres wirkliches Verb, ersteres in gleicher Bedeutung nur Hülfsverbum ist […]" (Herling 1828: 345)

<sup>&</sup>quot; Vollständige Nebensätze lassen sich mit Auslassung des Subjects, der Bezeichnung der Copula und der conjunctionalen Partikel zu bloßen Satztheilen verkürzen, die dann noch den Character ganzer Nebensätze behalten; z. B. " er behauptete, daß er dies nicht unternehmen könne" in: " er behauptete, dies nicht unternehmen zu können"." (Herling 1828: 206f)

### 1 Topologische Felder

selegierte Verb ist von dem selegierenden Verb lexikalisch abhängig. Finite Verben sind nie im relevanten Sinne selegiert, also immer unabhängig. Die infiniten Verben am Ende von satzwertigen Infinitivkonstruktionen – *zu müssen* in (85a) und (86a), *zu werden* in (87) – sind ebenfalls nicht selegiert und damit unabhängig. (Das*(rum)plagen* in (85a) und (86a) ist dagegen von *zu müssen* abhängig, und in (87) ist *gesehen* von *zu werden* abhängig.)

Solche satzwertigen Infinitivkonstruktionen können, wie (89) zeigt, kein Subjekt enthalten:

	- b. \* um Karl nicht gesehen zu werden, benutzte Karl den Hinterausgang

Bemerkenswerterweise müssen sie jedoch Prädikate enthalten, die ein Subjekt selegieren. *arbeit-* und *verachtet werd-* selegieren ein Subjekt (im Nominativ); vgl. (90). Die infiniten Sätze in (91) sind dementsprechend einwandfrei:

	- b. dort scheint \*(Karl) verachtet zu werden
	- b. Karl ist zu beliebt, um verachtet zu werden

*gearbeitet werd-* selegiert dagegen kein Subjekt, vgl. (92); und die infiniten Sätze in (93) sind unmöglich:

	- b. dort scheint (\*Karl) gearbeitet zu werden
	- b. \* es ist zu heiß, um gearbeitet zu werden

Sehr deutlich ist das bei Prädikaten wie *gefeiert werd-* und *gegrillt werd-*, die mit oder ohne Subjekt vorkommen können wie in (94). Die entsprechenden infiniten Konstruktionen in (95) können nur wie (94a) interpretiert werden:

	- ii. es ist spannend, wenn man gegrillt wird
	- b. i. es ist ein erhebendes Erlebnis, wenn gefeiert wird
		- ii. es ist spannend, wenn gegrillt wird

	- b. es ist spannend, gegrillt zu werden

Diese Eigenschaft satzwertiger Infinitivkonstruktionen – daß sie in einem systematischen Sinn ein Subjekt enthalten müssen, das jedoch phonologisch nicht realisiert werden kann – hat eine bemerkenswerte Folge. Es gibt Konstituenten gewisser Art, die sich auf ein Subjekt oder Objekt des eigenen Satzes 'beziehen' können und dabei mit der Bezugskonstituente im Kasus (und eventuell Genus und/oder Numerus) übereinstimmen müssen. Besonders deutlich ist das bei dem Ausdruck *ein- nach d- ander-*, der sich auf eine semantisch mehrzahlige Konstituente bezieht (sofern er nicht selber Subjekt oder Objekt o. ä. bildet). In (96a) bezieht sich *eine nach der anderen* auf das Subjekt *die Türen*, es ist Nominativ und feminin. In (96b) ist *einer nach dem anderen* Nominativ und maskulin; es muß sich auf das Subjekt *wir* beziehen, und die Referenten von *wir* müssen männliche Personen sein. In (96c) ist *einen nach dem anderen* Akkusativ; es muß sich auf das Akkusativobjekt *die Burschen* beziehen. Entsprechend in (96d); nur ist *die Burschen* hier ein 'AcI-Subjekt'. In (96e) ist *einer nach der anderen* Dativ und feminin; es muß sich auf das Dativobjekt *uns* beziehen, und die Referenten von *uns* müssen weibliche Personen sein. In (96f) bezieht sich *eins nach dem anderen* auf das Akkusativobjekt *die Fenster*; es ist Akkusativ und neutral:

	- b. einer nach dem anderen haben wir den Burschen runtergeputzt
	- c. einen nach dem anderen haben wir die Burschen runtergeputzt
	- d. ich ließ die Burschen einen nach dem anderen einsteigen
	- e. uns wurde einer nach der anderen der Stuhl vor die Tür gesetzt
	- f. ich soll die Fenster eins nach dem anderen austauschen

Dieselben Bezugsmöglichkeiten kommen in Infinitivkonstruktionen vor. In (97a) bezieht sich *einen nach dem anderen* auf *die Burschen*; in (97b) bezieht sich *einer nach der anderen* auf *uns*; in (c) bezieht sich *eins nach dem anderen* auf *die Fenster*:

	- b. er hat angekündigt, uns dann einer nach der anderen den Stuhl vor die Tür zu setzen
	- c. es ist nötig, die Fenster, sobald es geht, eins nach dem anderen auszutauschen

### 1 Topologische Felder

In (98a) bezieht sich *einer nach dem anderen* offensichtlich auf das implizite Subjekt des infiniten Satzes. Das implizite Subjekt ist semantisch mit *den Burschen* zu identifizieren; dies ist jedoch Dativobjekt (zu *geraten*), während *einer nach dem anderen* Nominativ ist und sich nicht unmittelbar darauf beziehen kann. In (98b) bezieht sich *eine nach der anderen* syntaktisch entsprechend auf das implizite Subjekt des durch *um* eingeleiteten Satzes; ähnlich in (98c). In (98d) kann man das implizite Subjekt, auf das sich *einer nach dem anderen* bezieht, semantisch mit *die Sklavenjäger* identifizieren; dies steht aber im Akkusativ, so daß ein unmittelbarer syntaktischer Bezug schon deshalb ausgeschlossen ist:

	- b. die Türen sind viel zu wertvoll, um eine nach der anderen verheizt zu werden
	- c. wir sind es leid, eine nach der anderen den Stuhl vor die Tür gesetzt zu kriegen
	- d. es wäre fatal für die Sklavenjäger, unter Kannibalen zu fallen und einer nach dem anderen verspeist zu werden

In allen diesen Fällen kann *ein- nach d- ander-* nicht selbst Subjekt sein: Satzwertige Infinitivkonstruktionen können kein explizites Subjekt haben, vgl. (89). Der Ausdruck muß sich vielmehr syntaktisch auf ein Subjekt der Infinitivkonstruktion beziehen und mit ihm im Kasus – Nominativ – übereinstimmen. Der Schluß scheint unvermeidlich, daß satzwertige Infinitivkonstruktionen obligatorisch ein phonologisch leeres Subjekt im Nominativ enthalten.<sup>23</sup> Umso auffälliger sind Beispiele wie (99), die unter das Schema (88) fallen:

	- b. die Größeren (bitte) im Vordergrund aufstellen
	- c. jeder zweite (bitte) hinter den Vordermann ducken

Der Satz (99a) enthält ein Subjekt im Nominativ (*der Kleine da vorn*). (99b) ist 2-deutig: Man kann *die Größeren* als Akkusativobjekt verstehen, dann ist das

<sup>23</sup>Dies gilt für alle Infinitkonstruktionen, die nicht lexikalisch selegiert sind, also z. B. auch für adnominale Partizipialkonstruktionen (*der von den Parteifreunden gefeierte Wahlsieg*), für infinite Interrogativsätze (*wozu lange darüber nachdenken?*) und für 'substantivierte Infinitive'. Es gilt nicht für finite oder für lexikalisch selegierte infinite Prädikate, vgl. (92). Auch wenn ein lexikalisch selegiertes (infinites) Prädikat selber ein Subjekt selegieren muß (z. B. wenn das Prädikat von *woll-* abhängig ist), muß dieses Subjekt nicht als phonologisch leere Konstituente repräsentiert werden; vgl. Höhle (1978: 84ff, 173ff; 1980: 67ff).

Subjekt ausgelassen; oder man kann *die Größeren* als Subjekt verstehen, dann ist ein Reflexivpronomen (von *sich aufstellen*) ausgelassen, wie es in (99c) der Fall ist. Die Verben haben die Form des Infinitivs. Wenn (99a) tatsächlich infinit ist, dann ist auffällig und in der deutschen Syntax einzigartig, daß der Satz ein explizites Subjekt im Nominativ enthält; zugleich ist dann die Auslassung des Reflexivums in (99c) und in der einen Interpretation von (99b) überraschend. Es dürfte angemessen sein, diese Verbformen trotz ihrer Gleichheit mit dem Infinitiv als spezielle finite Formen aufzufassen, die sich dadurch auszeichnen, daß (i) ein Reflexivum obligatorisch fehlt und (ii) das Subjekt (wie im normalen Imperativ) fakultativ fehlt.

Sätze, die das topologische Schema (88) erfüllen, weisen, wie ich sage, E-Stellung auf (oder: sind E-Sätze). Dabei soll das " <sup>E</sup>" an " End(-stellung)" erinnern. Sätze mit F1- und F2-Stellung bezeichne ich im Unterschied dazu zusammenfassend als F-Sätze (sie haben F-Stellung). Über E-Sätze und ihr Verhältnis zu F-Sätzen sind später [X, s. Anm. S. 4] noch einige Erwägungen anzustellen. In den folgenden Abschnitten lassen wir E-Sätze jedoch außer Betracht und konzentrieren uns ganz auf F2-Sätze. Um diese Vorgehensweise zu begründen, möchte ich etwas ausholen.

### **7 Lernbarkeit**

**7.1** F2-Sätzen kommt ein besonderes Interesse zu, weil sie unter den 3 topologischen Satzschemata den kompliziertesten Typ darstellen. Bei ihnen erheben sich zwei Fragen. (i) Was ist mit der Stellung des finiten Verbs; wie ist präzise zu charakterisieren, welchen Ort es in der Struktur des Satzes einnimmt, und wie ist sein Verhältnis zu anderen Teilen des Satzes, besonders zu den infiniten Verben, zu erfassen? Diese Frage stellt sich ähnlich bei F1-Sätzen. Bei F2-Sätzen kommt eine Frage hinzu: (ii) Was ist mit der Position *K*; welches Verhältnis hat sie zum Rest des Satzes, und wie kann man dieses Verhältnis präzise charakterisieren? Über diese deskriptiven Fragen hinaus stellt sich die Erklärungsfrage: Gibt es eine allgemeine Sprachtheorie, aus der – unter Annahme von gesicherten Randbedingungen – folgt, daß die Fakten grade so und nicht irgendwie anders sind?

Die deskriptiven und die explanativen Fragen sind nicht völlig unabhängig voneinander. Natürlich muß man, wenn man nach einer Erklärung für Tatsachen sucht, die zu erklärenden Tatsachen kennen. Aber wenn man gewisse Daten hat, ist nicht immer eindeutig, wie die Zusammenhänge zwischen diesen Daten adäquat zu erfassen sind, d. h. die Daten sind mit verschiedenen Hypothesen über die Fakten verträglich. Aber häufig sind nur wenige dieser Hypothesen auch mit

### 1 Topologische Felder

einleuchtenden explanatorischen Annahmen verträglich. Die Suche nach generellen erklärenden Prinzipien kann deshalb die Annahme bestimmter Analysen von Daten erzwingen, auch wenn diese Daten, für sich und ohne Einbettung in größere theoretische Zusammenhänge betrachtet, durchaus verschiedenen Analysen zugänglich wären. Die Meinung, man müsse grundsätzlich " erst" die Fakten klären, um " danach" zu einer Erklärung der Fakten fortschreiten zu können, ist unrichtig. Wie die Fakten beschaffen sind, kann man manchmal erst im Zusammenhang mit einer Erklärung der Fakten richtig beurteilen.<sup>24</sup>

Manche deskriptiven Fragen sind – oder scheinen vielmehr – leichter zu beantworten, wenn man die Analyse auf einem systematischen Vergleich zwischen F2- und E-Sätzen aufbaut. Das typische Ergebnis eines solchen Vergleichs sind Analysen in der Art von Bierwisch (1963), Klima (1965) oder einer der vielen Varianten davon. Wenn man von einigen Mängeln im Detail absieht, kann man durchaus einräumen, daß dies in ihren Grundzügen mögliche Deskriptionen der Daten sind. Der Ansatz hat jedoch zwei Mängel. Erstens erscheint er so einfach, daß einige alternative Deskriptionsmöglichkeiten gewöhnlich nicht hinreichend exploriert werden. Zweitens läßt er die Frage, wie ein Sprecher dazu kommen könnte, ein solches System zu erwerben, völlig unbeantwortet. Dieser zweite Gesichtspunkt ist so wichtig, daß er eine ausführlichere Betrachtung verdient.

**7.2** Die Analyse sprachlicher Daten, die ein Sprachwissenschaftler vornimmt, beruht auf der Gesamtheit aller irgendwie einschlägigen Informationen, deren der Sprachwissenschaftler habhaft werden kann. Besonders aufschlußreich sind dabei Urteile von reifen Sprechern über Akzeptabiltät und Bedeutung von Beispielen, die nicht alltäglich und stark stereotypisiert sind. Wenn ein Sprecher ein klares Urteil über solche nicht-alltäglichen Beispiele hat, dann muß dieses Urteil darauf beruhen, daß der Sprecher – unbewußt – Regeln befolgt; diese Regeln machen grade das aus, was man als (den wesentlichen Aspekt der) Sprachbeherrschung ansieht.

Wenn der Sprachwissenschaftler aufgrund solcher Urteile dem reifen Sprecher den Besitz eines komplexen und abstrakten Regelsystems unterstellt, sollte er sich nicht von der Frage dispensieren, auf welche Weise der Sprecher in den

<sup>24</sup>Das heißt natürlich nicht, daß die Fakten immer in jeder Hinsicht so undeutlich sind, daß sie mit beliebigen allgemeineren Theorien verträglich wären. Im Gegenteil; in vielen Einzelfällen sind die Fakten in mancher Hinsicht so deutlich, daß sie mit zahllosen allgemeineren Theorien nicht verträglich sind, insbesondere mit Theorien, die nicht – z. B. in Hinsicht auf Probleme der Lernbarkeit – explanatorische Potenz beanspruchen können, sondern nur irgendwelchen schlichten 'Einfachheits'-Bedürfnissen entgegenkommen. (Dies darzulegen war mein Ziel in Höhle (1980).) Nur Theorien mit empirisch wohlbegründeten Implikationen können eine Wahl zwischen alternativen Hypothesen über Fakten erzwingen.

Besitz dieses Systems gekommen ist. Selbst wenn man mit Katz (1981) darauf besteht, daß der Gegenstand der sprachwissenschaftlichen Theorienbildung sprachliche Regelsysteme sind und diese von der Existenz (psycho-)biologischer Systeme (Menschen) logisch unabhängig sind, sind die Umstände, unter denen die Verfügung über solche Regelsysteme normalerweise erworben wird, von größter Bedeutung für die sprachwissenschaftliche Theorienbildung. Sie ergänzen die sonstigen Informationen, über die der Sprachwissenschaftler verfügt, und können dazu beitragen, (i) die korrekte Wahl zwischen alternativen Hypothesen über die Fakten zu determinieren und (ii) generelle (notwendige) Eigenschaften der Regelsysteme, die natürlichen Sprachen zugrunde liegen, aufzudecken. Dabei sind es zwei Umstände, die ganz besondere Beachtung verdienen.

**7.2.1** Im natürlichen Spracherwerbsprozeß kommen Instruktionen über unakzeptable Beispiele nach allem, was man weiß, allenfalls in unbedeutendem Maß vor; vgl. Wexler & Culicover (1980: 64f). In Fällen, wo solche Instruktionen gegeben werden, bleiben sie im typischen Fall folgenlos; vgl. Braine (1971: 160f). Der Sprachwissenschaftler dagegen benutzt solche negativen Beurteilungen als besonders wichtige und reiche Datenquelle, eben weil sie das Wirken von Regelbesitz zeigen. Diese Regeln müssen in einer realen Spracherwerbssituation – das heißt hier besonders: ohne negative Instruktionen – erworben sein. Im typischen Fall erfüllen nur sehr wenige unter den logisch möglichen Hypothesen des Sprachwissenschaftlers diese Lernbarkeitsbedingung. (Ein besonders scharfes Problem sind negative Urteile des reifen Sprechers bei Regeln, deren Anwendung fakultativ ist; vgl. Baker (1979).) Im typischen Fall zeigt sich obendrein, daß relativ zu der Stimulusmenge des Sprachlerners die korrekte Hypothesenwahl überhaupt nur dann erzwungen wird, wenn man annimmt, daß der Freiraum der hypothetischen Regelbildung aufgrund spezifischer Prinzipien von vornherein – d. h. hinsichtlich des Sprachlerners: aufgrund genetisch bedingter Prädispositionen – sehr stark eingeschränkt ist.<sup>25</sup> Die Prinzipien, die diesen Freiraum von vornherein einschränken, sind damit Prinzipien, denen die Regelsysteme

<sup>25</sup>Hier – und nur hier – spielt die Annahme eine Rolle, daß die Urteile reifer Sprecher über gegebene Beispiele in hohem Maße übereinstimmen, wenn die Stimulusmengen, die diesen Sprechern während ihrer Spracherwerbsphase zugänglich waren, in wesentlicher Hinsicht ähnlich sind. Es wäre an sich möglich, daß ein Sprachlerner sich unter den verschiedenen logisch mit seiner Stimulusmenge verträglichen Hypothesen willkürlich die eine oder die andere herausgreift. Dann wäre zu erwarten, daß die reifen Sprecher – je nachdem, welche Regeln sie in der Erwerbsphase gewählt haben – über Beispiele außerhalb der ursprünglichen Stimulusmenge zu völlig verschiedenen Urteilen kommen. So etwas scheint sehr selten vorzukommen. Wenn man bedenkt, wie verschieden die Stimulusmengen verschiedener Sprachlerner auch innerhalb einer 'Sprachgemeinschaft' tatsächlich sind, ist die Übereinstimmung zwischen den reifen Sprechern höchst eindrucksvoll.

### 1 Topologische Felder

für alle natürlichen Sprachen unterliegen. Soweit sich solche Prinzipien nicht aus allgemeinen (nicht-sprachspezifischen) psychobiologischen Eigenschaften des Sprachlerners deduzieren lassen, muß man sie als notwendige Prinzipien von sprachlichen Regelsystemen überhaupt verstehen, und solche Prinzipien sind naturgemäß der Kern jeder sprachwissenschaftlichen Theorienbildung, grade auch der 'platonistischen' Theorie, für die Katz (1981) plädiert. Es dürfte kaum eine Forschungsstrategie geben, die besser geeignet ist, solche notwendigen Prinzipien aufzudecken, als die strikte Beachtung von realistischen Lernbarkeitsbedingungen für Regeln, denen der reife Sprecher folgt, ohne darüber instruiert worden zu sein.

**7.2.2** Neben unakzeptablen Beispielen<sup>26</sup> sind vor allem komplexe Beispiele – besonders: Beispiele, die (u. U. mehrfach) eingebettete Sätze enthalten – eine Datenquelle von großer praktischer Bedeutung für den Sprachwissenschaftler; und zwar wieder deshalb, weil solche Beispiele im typischen Fall außerhalb der alltäglich zu beobachtenden Sprachproduktion liegen und deshalb im Allgemeinen nicht stereotypisiert oder gar als solche auswendig gelernt sein können. In dem Maße, wie sie sicher und konsistent beurteilt werden, muß sich hier wieder die Wirkung von allgemeinen Regeln niederschlagen, denen die Sprecher folgen. Das lernbarkeitstheoretische Problem dabei ist, daß hochgradig komplexe Sätze beim Erwerb derartiger Regeln im Allgemeinen sicherlich keine Rolle spielen, daß die Urteile über komplexe Beispiele also aufgrund von Regeln gefällt werden, die anhand von relativ einfachen Beispielen in der Stimulusmenge erworben sind. Dies ergibt sich aus zwei Überlegungen. Erstens sind in natürlicher Kommunikation auch zwischen reifen Sprechern hochgradig komplexe Sätze ausgesprochen selten, und im Umgang mit Kindern finden sie noch weniger Verwendung. Zweitens spricht viel dafür, daß Kinder in frühen Stadien des Spracherwerbs nicht im Stande sind, komplexe Sätze – insbesondere: Sätze, die eingebettete Sätze enthalten – konsistent zu interpretieren. In der Stimulusmenge, die der Sprachlerner als Basis für den Regelerwerb benutzt, sind in diesen frühen Stadien also vermutlich gar keine komplexen Sätze enthalten.

In späteren Stadien sind die Kinder fähig, komplexe Sätze zu verstehen, und gebrauchen selber Sätze, die einen eingebetteten Satz enthalten. Diese korrekte Verwendung eingebetteter Sätze setzt gewisse Informationen über die Eigenschaften solcher Sätze in der Stimulusmenge voraus. Das zeigt sich deutlich bei eng verwandten Sprachen. So können in einigen deutschen Dialekten Relativ-

<sup>26</sup>Damit meine ich nicht nur Beispiele, die schlechthin unakzeptabel sind, sondern auch Beispiele, die eine bestimmte geforderte Interpretation nicht haben können, die also 'unter dieser Interpretation' unakzeptabel sind.

sätze mit einer Partikel *wo* o. ä. an Stelle von oder in Kombination mit einem Relativpronomen gebildet werden (z. B. *der Kerl, (den) wo ich gestern getroffen habe*), und einige erlauben ein *daß* bei indirekten Interrogativsätzen (z. B. *ich weiß nicht, wen daß du gestern getroffen hast*); beides ist im Standarddeutschen unmöglich und korreliert nicht mit irgendwelchen Eigenschaften von nicht-eingebetteten Sätzen. Sowohl die Möglichkeit innerhalb solcher Dialekte, derartige Partikeln zu gebrauchen, als auch die Unmöglichkeit solcher Partikeln im Standarddeutschen muß der Sprachlerner in irgendeiner Weise anhand der Beispiele mit Relativ- bzw. indirekten Interrogativsätzen in seiner Stimulusmenge erschließen.

Gewisse Informationen über Sätze mit der Einbettungstiefe D<sup>1</sup> (Degree 1, d. h. Sätze, die einen Satz enthalten, der in genau 1 Konstituente vom Typ 'Satz' echt enthalten ist) sind also notwendig für den Erwerb der Regeln für eingebettete Sätze. Mit größter Wahrscheinlichkeit sind diese Informationen aber zugleich hinreichend für den Erwerb der Regeln, die die Beurteilung von Sätzen mit beliebiger Einbettungstiefe D*<sup>n</sup>* (*n*≥1) erlauben. Denn es spricht nichts dafür, daß der Sprachlerner während der relevanten Erwerbsphasen überhaupt Beispiele mit größerer Einbettungstiefe als D<sup>1</sup> in seiner Stimulusmenge hat, und nach aller sprachwissenschaftlichen Erfahrung sind die Regeln, die in hochgradig komplexen Sätzen wirksam sind, identisch mit den Regeln, die in D1-Sätzen wirksam sind. Für alle faktisch vorkommenden Regeln, die speziell mit eingebetteten Sätzen zu tun haben, ist deshalb zu fordern: Sie müssen anhand von Beispielen mit der Einbettungstiefe D<sup>1</sup> erworben werden können.<sup>27</sup>

Ohne Frage müssen gewisse Regeln für eingebettete Sätze anhand von eingebetteten Sätzen in der Stimulusmenge eigens erworben werden. Aber sicherlich müssen nicht alle Eigenschaften eingebetteter Sätze eigens erworben werden. Eine plausible Vermutung ist, daß der Sprachlerner so weit, wie es irgend möglich ist, auf eingebettete Sätze dieselben Regeln anwendet wie auf uneingebettete Sätze. Diese Vermutung ist nicht nur intuitiv einleuchtend, sondern wird auch durch Spracherwerbsdaten nahegelegt. Deutsch lernende Kinder produzieren eingebet-

<sup>27</sup>Das heißt nicht, daß Regeln, die aus irgendwelchen Gründen nur in Sätzen mit größerer Einbettungstiefe (etwa bei D4-Sätzen) wirksam sind, in einer allgemeinen Sprachtheorie prinzipiell unmöglich sein müssen. Aber solche Regeln sind unter natürlichen Erwerbsbedingungen nicht erwerbbar, weil so komplexe Beispiele in den Stimulusmengen der Sprachlerner nicht in hinreichendem Maß präsent sind.

Wexler & Culicover (1980) weisen nach, daß Regelsysteme, die gewissen Prinzipien genügen, anhand von Beispielen mit der Einbettungstiefe D<sup>2</sup> lernbar (in einem speziellen formalen Sinne von " lernbar") sind. Meine Forderung ist wesentlich schärfer. Allerdings definieren sie die Einbettungstiefe in Hinsicht auf Basis-Phrasemarker, während ich unter 'Satz' hier eine Kategorie der 'Oberfläche' verstehe. Wieweit dieser Unterschied wichtige empirische Konsequenzen hat, ist schwer zu übersehen.

### 1 Topologische Felder

tete Sätze erst, wenn sie die Regeln für uneingebettete Sätze bereits weitestgehend beherrschen; gewöhnlich erst etliche Monate später (vgl. Park 1981, Clahsen 1982). Soweit ich weiß, ist das bei allen Sprachen so. Faktisch sind die Regeln für eingebettete Sätze zum großen Teil identisch mit den Regeln für uneingebettete Sätze. Es ist schwer vorstellbar, daß der Sprachlerner eingebettete Sätze zu analysieren und zu produzieren versucht, ohne dabei von den für uneingebettete Sätze bereits erworbenen Regeln Gebrauch zu machen, und dennoch für eingebettete Sätze Regeln erwirbt, die mit den Regeln für uneingebettete Sätze so weitgehend übereinstimmen. Es ist im Gegenteil eine natürliche Annahme, daß die Analyse eingebetteter Sätze dem Kind überhaupt erst dank der Regeln für uneingebettete Sätze zugänglich wird.

Wenn man diese Vermutung akzeptiert, muß man auch annehmen, daß der Erwerb der Regeln für uneingebettete Sätze gar nicht (oder nur in ganz unbedeutendem Maße) durch die Kenntnis eingebetteter Sätze beeinflußt wird. Dies stimmt wieder mit den Spracherwerbsdaten überein: Es ist nicht bekannt, daß ein Sprachlerner seine Regeln für uneingebettete Sätze zu dem Zeitpunkt, wo er eingebettete Sätze zu produzieren beginnt, in Übereinstimmung mit seinen Regeln für eingebettete Sätze geändert hätte.<sup>28</sup>

Ich nehme also, zusammenfassend, (100) an:

	- b. Danach werden die Regeln für einfach eingebettete Sätze (D<sup>1</sup> ) erworben.
	- c. In der Phase (b) werden, soweit es mit den Daten in der Stimulusmenge irgend vereinbar ist, die in der Phase (a) erworbenen Regeln benutzt.
	- d. Diese Regeln werden dabei nicht aufgrund von Beobachtungen geändert, die sich nur an eingebetteten und nicht an uneingebetteten Sätzen machen lassen.
	- e. Im Normalfall werden keine speziellen Regeln für mehrfach eingebettete Sätze (D*n*, *n>*1) erworben.

Diese Annahmen stehen, wie gesagt, in guter Übereinstimmung mit dem, was man über die Phasen des Spracherwerbs weiß. Zugleich haben sie einen interessanten explanativen Gehalt. Aus (100) folgt, daß hochgradig komplexe Sätze auf-

<sup>28</sup>Wahrscheinlich gibt es schon vor Beginn der Produktion eingebetteter Sätze eine Phase, in der solche Sätze weitgehend korrekt analysiert werden. Es wäre vorstellbar, daß diese Analyseergebnisse die Formulierung der Regeln für uneingebettete Sätze beeinflussen. Mir scheint diese Überlegung zweifelhaft. In jedem Fall sollten allgemeine Überlegungen zur Lernbarkeit diese Vorstellung nicht als notwendig wahr unterstellen.

grund rekursiver Anwendung von Regeln für Sätze von der Einbettungstiefe D<sup>0</sup> und D<sup>1</sup> analysiert und produziert werden; hochgradig komplexe Sätze müssen nach (100) kompositionell aufgebaut sein, und wenn sie nicht-kompositionelle (idiomatische) Bestandteile enthalten, müssen diese auch in einfachen Sätzen zu finden sein.<sup>29</sup> Ausnahmen von diesem Grundsatz sind nur möglich, wenn positive Lernerfahrungen, d. h. Beispiele für solche Ausnahmefälle in der Stimulusmenge, vorliegen.

**7.2.3** Die Annahmen (100) werden, wenn ich es richtig verstehe, von vielen Autoren geteilt. Überraschenderweise nehmen dieselben Autoren gewöhnlich an, daß derartige Abfolgen verschiedener Erwerbsphasen den Erwerb der korrekten Regeln irgendwie erleichtern würden. Dabei wird jedoch nicht erläutert, inwiefern und warum die Erwerbsaufgabe unter diesen Annahmen leichter sein sollte oder überhaupt leichter sein könnte, als wenn komplexe Konstruktionen aller Art in gleicher Weise und zur gleichen Zeit als Basis des Erwerbsprozesses dienen. Tatsächlich wird nach der Logik der Sachlage das Lernbarkeitsproblem dadurch kolossal verschärft; vgl. Wexler & Culicover (1980: §2.7.3).

Schon dadurch, daß der Sprachlerner – im Gegensatz zum Sprachwissenschaftler – keinen wesentlichen Gebrauch von negativen Daten macht, wird die Menge der für den Erwerbsprozeß potentiell hilfreichen Informationen quantitativ und qualitativ gewaltig eingeschränkt. Wenn außerdem gemäß (100) das Konzept der Einbettung eines Satzes als Konstituente in einen Trägersatz einzig anhand von einfachen Einbettungen (D<sup>1</sup> ) erworben werden muß, entstehen weitere Probleme. Dem naiven Blick stellen sich komplexe Sätze als lockere Folge von einfachen (uneingebetteten) Sätzen dar (oder als Sätze mit parenthetischen Einsprengseln). Forschungsgeschichtlich war es ein weiter Weg bis zu der einfachen und durchsichtigen Lehre von Herling (1821b), daß (i) Sätze aus Konstituenten aufgebaut sind und daß eine solche Konstituente (ii) mit Konstituenten gleicher Art in bestimmter Weise zusammengefügt werden kann (Koordination) und/oder (iii) selbst ein Satz sein kann (Einbettung). Im Deutschen lassen sich Sätze von beliebiger Komplexität vollständig und widerspruchsfrei mit Hilfe der topologischen Schemata für F1-, F2- und E-Sätze analysieren. Aber dies ist keine triviale Analyseaufgabe und setzt die Konzepte der Koordination und der Einbettung voraus. Der Sprachwissenschaftler kann diese Konzepte durch extensive Analyse sehr komplexen

<sup>29</sup>Ich unterscheide zwischen " kompositionell" und " strikt kompositionell". Ein Ausdruck A ist kompositionell, wenn seine Bedeutung aufgrund genereller Regeln aus der Bedeutung der Bestandteile von A und syntaktischen (und eventuell intonatorischen) Eigenschaften von A resultiert. A ist strikt kompositionell, wenn nicht allgemein die Bestandteile von A, sondern nur die unmittelbaren Konstituenten von A in die Regeln eingehen. Es ist ein empirisches Faktum, daß hochgradig komplexe Ausdrücke in natürlichen Sprachen kompositionell sind; in welchem Maße strikte Kompositionalität herrscht, ist dagegen eine offene Frage.

### 1 Topologische Felder

Beispielmaterials begründen; dem Sprachlerner ist dieses Verfahren schon aufgrund der Armut seiner Stimulusmenge versagt. Es ist überhaupt nicht zu sehen, wie diese Konzepte anhand der Stimulusmenge erworben werden könnten. Für die Phase (100b) muß der Sprachlerner diese Konzepte bereits mitbringen. Wenn er das tut, kann er gemäß (100c) hilfreichen Gebrauch von den Regeln für uneingebettete Sätze machen. Wenn er diese Konzepte nicht voraussetzt, ist nicht zu verstehen, wie er jemals die Fähigkeit erwerben könnte, die Bildung von Sätzen größerer Komplexität zu beherrschen.

Darüber hinaus haben eingebettete Sätze Eigenschaften, die sich überhaupt erst bei einer Einbettungstiefe von D<sup>2</sup> zeigen, z. B. sind Extrapositionen – besonders: Extrapositionen von Sätzen – 'rightward bounded'; vgl. Höhle (1980). Solche Eigenschaften können nicht anhand von Beispielen mit der Einbettungstiefe D<sup>1</sup> erworben werden; obendrein beruht die Kenntnis von dieser Eigenschaft auf negativen Daten (z. B. \**daß die Leute schlafen, ist bekannt, von denen du gesprochen hast*). Wenn (100e) richtig ist, müssen derartige Eigenschaften zu den Prädispositionen gehören, die der Sprachlerner beim Erwerb der Regeln bereits voraussetzt. Da nicht zu sehen ist, wie sie aus allgemeinen (nicht-sprachspezifischen) Prinzipien folgen könnten, wird man sie als notwendige Prinzipien von sprachlichen Regelsystemen betrachten müssen, die der Sprachlerner allenfalls dann überwindet, wenn ihn reiche Belege in der Stimulusmenge dazu zwingen.

Das bei weitem schärfste Lernbarkeitsproblem stellt sich jedoch in der Phase (100a). Wenn der Sprachlerner beim Erwerb der Regeln für uneingebettete Sätze – im Gegensatz zum Sprachwissenschaftler – tatsächlich auf jede Information verzichtet, die aus der Analyse komplexer Sätze (z. B. aus dem systematischen Vergleich von eingebetteten und uneingebetteten Sätzen) gewonnen werden könnte, verarmt die Menge der potentiell hilfreichen Informationen quantitativ und qualitativ in einem Maße, daß der Erwerb der korrekten Regeln als unlösbare Aufgabe erscheint – es sei denn, daß die Menge der Regelformulierungen, die mit den Daten kompatibel sind, von vornherein sehr scharf begrenzt ist. Die Abschnitte X [s. Anm. S. 4] werden das reichlich illustrieren.<sup>30</sup>

<sup>30</sup>Was wir hier anhand eingebetteter Sätze besprochen haben, gilt natürlich ganz allgemein für komplexe Konstituenten, die aufgrund rekursiv angewendeter Regeln gebildet werden, z. B. komplexe Nominalphrasen und auch komplexe Wörter. Allerdings wird dies bei komplexen Wörtern – Wörtern, die mehrere freie und/oder gebundene Morpheme enthalten – dadurch etwas verdunkelt, daß hier der Anteil von nicht-kompositionellen (idiomatischen) Bildungen außerordentlich groß ist. Ich führe das darauf zurück, daß beim Erwerb von Wörtern spezielle Mechanismen wirksam sind, die den Sprachlerner einerseits zu einer sehr frühen und sicheren Wahrnehmung der Bedeutung, der Wortklasse und der unprädiktablen Kombinationseigenschaften ('Valenz') der Wörter befähigen und damit eine Grundlage für den Erwerb des syntaktischen Regelsystems legen, andererseits aber auch den stereotypisierten Gebrauch der Wörter begünstigen und damit die gewaltige Menge von Irregularitäten bei Wortbildungsprodukten verantworten.

**7.3** Allerdings muß man im einzelnen unterscheiden. Auch bei uneingebetteten Sätzen sind gewisse Analysen, die der Sprachlerner durchführt, möglicherweise aufgrund allgemeiner (nicht-problemspezifischer) Annahmen verständlich. Betrachten wir (101):

(101) a. der Hund erblickte einen Hasen

b. the dog saw a rabbit

Beide Sätze haben die Folge (102a), aber (101b) manifestiert das Schema (102b), während (101a) das Schema (102c) manifestiert:

	- b. S*>*V*>*O
	- c. *K* ⌢fV*>KM*
	- d. S*>*fV*>*O
	- e. *K>*V*>KM*

Die Spracherwerbsdaten für Englisch bzw. Deutsch lernende Kinder zeigen, daß die Sprachlerner die Sätze tatsächlich so analysieren. Aber wie kommen sie zu diesen Schlüssen; warum könnte (101a) nicht (102b), (102d) oder (102e) manifestieren; warum könnte (101b) nicht (102c), (102d) oder (102e) manifestieren? Es scheint, daß man eine Reihe von Annahmen machen muß:

	- b. Wenn stilistisch neutrale Deklarativsätze in der Stimulusmenge nur durch 1 bestimmte Abfolge von Subjekt, Objekt und Verb repräsentiert sind, wird diese Abfolge als das charakteristische Schema für Deklarativsätze interpretiert.

Diese Annahmen reichen aus dafür, daß ein Englischlerner (102c) und (102e) verwirft, denn ihm begegnen stilistisch neutrale Deklarativsätze nur mit der Abfolge (102a); ein Deutschlerner muß dagegen (102b) und (102d) verwerfen, weil ihm auch andere stilistisch neutrale Abfolgen als (102a) begegnen. Ob die Prinzipien (103) spezifisch sprachlich sind oder auf allgemeine kognitive Prinzipien reduziert werden können, ist schwer zu beurteilen, und ich will darauf nicht eingehen. Jedenfalls setzt (103) voraus, daß die Klassifikationskategorien, die Greenberg für die Typologie vorgeschlagen hat, auch dem Sprachlerner zur Verfügung stehen und von ihm wesentlich benutzt werden.

### 1 Topologische Felder

Bei der weitergehenden Frage, wie der Englischlerner zwischen (102b) und (102d) wählt, werden weitere Annahmen nötig. Der interessante Aspekt bei dieser Frage ist, daß (uneingebettete) stilistisch neutrale Deklarativsätze des Englischen tatsächlich immer das Schema (102d) erfüllen. Das tritt deutlich hervor, wenn man direkte Entscheidungs-Interrogativsätze zum Vergleich heranzieht, etwa (104):

	- b. has the dog seen a rabbit?

Sie unterscheiden sich von Deklarativsätzen nicht durch die Position des Hauptverbs – auch die Beispiele (104) erfüllen das Schema (102b) –, sondern durch die Position des finiten Verbs. Ihr topologisches Schema ist (105):

(105) <sup>f</sup>V ⌢S*>*V*>*O

Um Deklarativsätze im Unterschied zu (105) zu kennzeichnen, müßte man, so scheint es demnach, entweder (102d) oder (106) wählen:

(106) (X)⌢S*>*V*>*O wobei X≠fV

Diesen Schluß kann man vermeiden, wenn man ein Prinzip wie (107) annimmt:

(107) Wenn es für direkte Interrogativsätze charakteristische topologische Schemata gibt, sind sie durch ihre Abweichung von dem Schema für Deklarativsätze gekennzeichnet.

Eine Annahme wie (107) ist in keiner Weise selbstverständlich oder trivial, entspricht aber ganz traditionellen Vorstellungen und ist implizit in Greenbergs Darstellung; vgl. (25). Man kann (107) als Folge der Annahme verstehen, daß Interrogativsätze im Verhältnis zu Deklarativsätzen als Satztyp 'markiert' sind. Wenn (107) korrekt ist und (105) das Schema für direkte (Entscheidungs-)Interrogativsätze ist, reicht es aus, Deklarativsätze durch (102b) zu kennzeichnen; (102b) wird dann zwingend als (106) interpretiert, ohne daß dies eigens angegeben werden muß.

Selbst wenn man diese Annahmen soweit für gesichert hält, bleibt immer noch offen, warum der Sprachlerner nicht (102d) annimmt. Hier wird nun eine Tatsache wichtig, die sich aus Beobachtungen zum Spracherwerb ergibt:

(108) Flexionseigenschaften von Wörtern werden in einem späteren Stadium erworben als charakteristische topologische Eigenschaften von Satzkonstituenten.

Aus (108) ergibt sich, daß der Englischlerner in einem frühen Stadium überhaupt nur (102b) und nicht (102d) erwerben kann, weil er das System der (verbalen) Flexion noch gar nicht beherrscht. Was er später zusätzlich erwirbt, ist das (nicht in allen Einzelsprachen gültige) Prinzip (109):

(109) Im typischen Fall ist das unabhängige Verb innerhalb eines Satzes finit.

Aus (109) in Verbindung mit (102b) folgt, daß Deklarativsätze (im typischen Fall) in der Form (102d) realisiert werden; nichts zwingt den Sprachlerner dazu, (102d) selbst als das charakteristische Schema anzunehmen. Man kann damit rechnen, daß der Sprachlerner an dem Schema (102b) auch nach dem Erwerb von (109) festhält, wenn man außerdem die Annahme (110) macht:

(110) Regeln, die einmal erworben worden sind, werden nur dann geändert, wenn die Informationen in der Stimulusmenge dazu zwingen.

Die Annahme (110) hat eine wichtige Konsequenz. Dasselbe topologische Schema wie für (stilistisch neutrale) uneingebettete Deklarativsätze gilt für einen großen Teil der eingebetteten Sätze (wobei im Allgemeinen eine Konjunktion, etwa *that*, an den Anfang tritt); nach (100c) und (107) ist das nicht überraschend. Hier gibt es aber 'untypische' Fälle, nämlich infinite Sätze. Beispiele wie (111) manifestieren (102b) in derselben Weise, wie finite Sätze es tun:

(111) for the poor to do the job (is pleasant for the rich)

Es ist eine wichtige Frage, warum gemäß (108) Flexionseigenschaften relativ spät erworben werden. Aber die Tatsache, daß das so ist, erkärt in Verbindung mit (110), warum (102b) und nicht (102d) gewählt wird.

Für den Deutschlerner haben wir bisher offen gelassen, wie er zwischen (102c) und (102e) wählen kann. Es wäre möglich, daß er, solange er das (verbale) Flexionssystem nicht beherrscht, das Schema (102e) annimmt. Sobald er die Flexion beherrscht, könnte er durch Beispiele wie (112) gezwungen sein, das erste Vorkommen eines Verbs als finit zu spezifizieren, also (102e) durch (102c) zu ersetzen:

	- b. der Hund hat einen Hasen erblickt

(Das Prinzip (109) würde zulassen, daß das infinite Vollverb an zweiter und das finite Hilfsverb an letzter Stelle steht.) Aber es ist fraglich, ob der Deutschlerner jemals (102e) annimmt. Falls (103) im Kern richtig ist, sucht der Sprachlerner nach einer charakteristischen Abfolge von Subjekt, Objekt und Verb. (102e) kann mit

### 1 Topologische Felder

einem solchen gesuchten Muster gar nichts zu tun haben, da Subjekt und Objekt darin nicht erwähnt sind.

Wenn der Sprachlerner nach einem solchen Muster sucht, kommt im Deutschen überhaupt nur (113) in Frage:

### (113) (S/O)*>*(O/S)*>*V

Wenn am Satzende ein Verb steht, wie es in vielen Beispielen innerhalb natürlicher Stimulusmengen der Fall ist, stehen Subjekt und Objekt immerhin auf jeden Fall vor dem Verb (und in einem Großteil der Fälle steht das Subjekt vor dem Objekt). Falls der Sprachlerner (i) ein ausgeprägtes Bedürfnis hat, die Stellung des Verbs (primär des Vollverbs) relativ zu Subjekt und Objekt zu fixieren, und (ii) frühzeitig – wenn auch undeutlich – bemerkt, daß bei der F-Stellung des Verbs ein komplizierender Faktor (Finitheit) eine Rolle spielt und die Stellung des Subjekts in stilistisch neutralen Deklarativsätzen variiert, könnte er dazu kommen, (113) anzunehmen; aber keinesfalls (102e). Wenn man unterstellt, daß die F-Stellung des Verbs vor Beherrschung der verbalen Flexion für den Sprachlerner weitgehend unverstanden bleiben muß (weil sie mit keiner konstanten topologischen Relation zwischen Subjekt, Objekt und Vollverb verbunden ist), muß (113) als die einzige sichere Hypothese erscheinen: Subjekt und/oder Objekt vor dem Vollverb ist nie verkehrt, solange das Verb nicht finit ist.

So unsicher diese Überlegungen beim gegenwärtigen Kenntnisstand sein müssen, sie haben eine interessante Implikation. Sie machen verständlich, wieso der Sprachlerner die Endstellung des Verbs im Deutschen mit besonderer Sensitivität wahrnimmt. Daß er das tut, geht eindeutig aus den Spracherwerbsdaten hervor. Es ist mehrfach bemerkt worden, daß Äußerungen vom Typ O*>*V in der kindlichen Sprachproduktion auffällig häufig sind, häufiger, als man nach der Häufigkeit von Beispielen des Typs (101a) in den Stimulusmengen erwarten könnte; vgl. Park (1981), Clahsen (1982) und dort genannte Literatur. Und es gibt Kinder, die während einer kurzen Phase nach dem Erwerb der Verbalflexion S*>*O*>*fV-Äußerungen (*Hansi Hunger hat* u. ä.) produzieren. Das ist bemerkenswert; uneingebettete Beispiele dieser Art kommen in den Stimulusmengen nicht vor. Verständlich ist es, wenn diese Sprachlerner eine in früheren Stadien erworbene Analyse wie (113) bereits mit (109) kombinieren und (113) noch nicht zu (48) weiterentwickelt haben.

**7.4** Unsere Überlegungen lösen nicht alle Probleme beim Erwerb der topologischen Eigenschaften von Verben im Englischen oder Deutschen. Es wäre auch verfrüht, ein vollständiges System von Prinzipien vorzuschlagen, die den Erwerb

der korrekten einzelsprachlichen Regelsysteme ermöglichen. Mir kommt es hier vielmehr darauf an, deutlich zu machen, daß die Aufgabe des Sprachlerners, korrekte Hypothesen über das Regelsystem zu entwickeln, das den Beispielen in der Stimulusmenge zugrunde liegt, unvergleichbar schwieriger ist als die Aufgabe des Sprachwissenschaftlers. Dem Sprachlerner fehlt der größte Teil der Indizien, deren sich der Sprachwissenschaftler bedient: negative Daten und komplexe Sätze. Dies zwingt zu der Annahme, daß der Sprachlerner von einer Reihe von Prinzipien geleitet wird. Zu einem Teil folgen diese Prinzipien vermutlich aus allgemeinen (nicht spezifisch sprachlichen) psychobiologischen Eigenschaften des heranreifenden Organismus. Aber es gibt keinerlei Grund zu der Vermutung, daß alle Prinzipien, die für den Erwerb sprachlicher Regelsysteme angenommen werden müssen, so allgemeiner Natur sind. Manche von ihnen könnten aus spezifisch sprachlichen Prädispositionen resultieren, über die der Sprachlerner aufgrund seiner biologischen Erbanlagen verfügt.

Die Prinzipien, die ich hier und in späteren Abschnitten formuliere, sind natürlich höchst tentativ. Auch dort, wo sie mit größter Wahrscheinlichkeit spezifisch sprachlicher Art sind, sind sie nicht als irreduzible Axiome gedacht. Ganz im Gegenteil: Wenn es notwendige spezifisch sprachliche Prinzipien gibt, die genetisch vererbt werden, dann erwartet man nicht, daß es außerordentlich viele Prinzipien solcher Art gibt, deren Wirkung sich nur in ganz speziellen Eigenschaften oder gar einzelnen Konstruktionen gewisser Sprachen niederschlagen. Man erwartet vielmehr, daß es relativ wenige (und damit notwendig sehr abstrakte) Grundprinzipien gibt, aus deren Interaktion eine reiche Menge von spezifischen Prinzipien zu deduzieren ist, und es sollte sich bei hinreichend genauer Analyse in so gut wie jeder Einzelsprache Evidenz für diese Grundprinzipien finden lassen.

Ein Standardeinwand gegen alle Lernbarkeitserwägungen lautet: (i) Im Laufe der Kindheit erwirbt ein Mensch sehr viele höchst erstaunliche Fähigkeiten; der Spracherwerb ist in dieser Hinsicht nicht einzigartig. (ii) In keinem der vielen Teilbereiche verfügen wir über eine nennenswert strukturierte Theorie. Über höhere kognitive " Lern"-Vorgänge wissen wir so gut wie nichts, unsere Unkenntnis ist in diesem Bereich grenzenlos. (iii) Es ist deshalb nicht auszuschließen, daß der Mensch über eine enorm leistungsfähige unspezifische Fähigkeit zur Entwicklung richtiger Theorien verfügt. (iv) Deshalb ist es müßig, über Prinzipien zu spekulieren, die speziell für den Erwerb sprachlicher Regelsysteme relevant sind, und (v) die Annahme spezifisch sprachlicher notwendiger Prinzipien entbehrt grundsätzlich jeden empirischen Gehalts.

Bei Einwänden dieser Art imponiert der Mangel an Folgerichtigkeit. Die Teile (i), (ii) und (iii) mögen zutreffen. Der Teil (iv) folgt nicht daraus, und der Teil (v)

### 1 Topologische Felder

ist falsch. Die Existenz einer hinreichend starken allgemeinen Theoriebildungsfähigkeit, die in (iii) angenommen wird, ist nicht demonstriert, und es scheint wenig Aktivität bei der Konkretisierung dieser Idee zu geben. Viel Fortschritt ist da auch nicht zu erwarten, solange nicht einmal für einen relativ kleinen Teilbereich wie den Erwerb sprachlicher Regelsysteme überall völlig deutlich ist, wie das Verhältnis zwischen der Menge der primären Stimuli (hier: Äußerungen verhältnismäßig geringer Komplexität) und dem Endzustand des Erwerbsprozesses (hier: Besitz eines Systems von spezifisch sprachlichen Regeln) beschaffen ist. Die in (iv) genannte 'Spekulation' dient zwei Zielen: erstens dazu, das Verhältnis zwischen Stimuli und Endzustand ganz allgemein genauer zu charakterisieren; zweitens dazu, die Regeln in einigen Zweifelsfällen korrekt zu formulieren. Wenn solche Prinzipien ihrer Aufgabe gerecht werden sollen, sind sie einer extrem starken Adäquatheitsbedingung unterworfen. Sie müssen zu allen historisch überschaubaren Zeiten in allen Kulturen für alle Individuen, die sich ansonsten normal entwickeln und normalen Randbedingungen ausgesetzt sind, Gültigkeit haben. Man erwartet, in jedem Einzelfall Indizien für die Wirksamkeit dieser Prinzipien zu finden, und es darf keinen Einzelfall geben, der mit diesen Prinzipien nicht verträglich ist. Wenn sich alle derartigen Prinzipien auf allgemeinere kognitive Prinzipien reduzieren lassen, ist das kein Schaden: Dann hat die allgemeine Theoriebildungsfähigkeit von (iii) etwas von jener Konkretisierung erfahren, die ihr bislang fehlt. Gelingt eine solche Reduktion im Einzelfall nicht, ist ein spezifisch sprachliches Prinzip gefunden.

Es ist denkbar, daß Prinzipien, die diesen Anforderungen genügen, niemals gefunden werden. Ernste Forschungsanstrengungen auf diesem Gebiet gibt es erst seit wenigen Jahren. Alles, was man heute erwägen kann, hat vorläufigen Charakter und bedarf intensiver Überprüfung und Fortentwicklung im Forschungsprozeß. Aber es gibt ermutigende Ansätze, und es gibt Wege, sich darüber rational und produktiv auseinanderzusetzen (vgl. z. B. die Beiträge in Baker & McCarthy (1981)). Bei aller Ungewißheit im Einzelnen ist eins sicher: Allgemeine Prinzipien der besprochenen Art wird man – falls es sie gibt – nicht aufdecken, wenn man Fragen der Lernbarkeit ignoriert.

**7.5** Der Sprachlerner erwirbt vermutlich als erstes die Regeln für uneingebettete Sätze. Die prototypischen uneingebetteten Sätze des Deutschen sind deklarative F2-Sätze. Uneingebettete E-Sätze, wie wir sie in 6. gesehen haben, sind in der Stimulusmenge vermutlich relativ selten vertreten; in jedem Fall gehören sie einem intuitiv stark 'markierten' Typ an. Es bestehen Zweifel, ob ein Sprachlerner solche intuitiv 'markierten' Satztypen (dann, wenn er ihnen begegnet) als

Evidenz beim Prozeß des Regelerwerbs für F2-Sätze heranzieht; jedenfalls sollte eine allgemeine Sprachtheorie dies nicht voraussetzen. Bei der Erörterung von F2-Sätzen in den nächsten Abschnitten versuchen wir deshalb auch dort, wo es nur um die rein deskriptive Erhellung der Fakten geht, E-Sätze ganz außer Betracht zu lassen. Wenn es dem Sprachlerner gelingt, die Regeln für F2-Sätze ohne Rückgriff auf E-Sätze zu erwerben, sollte es möglich sein, alles Nötige den F2-Sätzen selbst zu entnehmen, und die Verhältnisse in E-Sätzen sollten, wenn (100c) richtig ist, durch minimale Ergänzung der Regeln für F2-Sätze gewonnen werden können. Es wird sich zeigen [X, s. Anm. S. 4], daß diese Erwartung sich in einem bestimmten Bereich erfüllt, daß unter diesem Ansatz aber auch ein bestimmtes Problem in der Syntax von E-Sätzen scharf hervortritt.

Aus ähnlichen Gründen lassen wir F1-Sätze vorläufig ganz beiseite. Man muß annehmen, daß sie in normalen Stimulusmengen nicht selten vertreten sind, aber möglicherweise stellen sie – besonders wenn sie Imperativsätze sind – einen intuitiv 'markierten' Typ dar, den man bei der Analyse der 'unmarkierten' F2-Sätze nicht voraussetzen sollte. (Unter Lernbarkeitsgesichtspunkten ist der Vergleich zwischen F1- und F2-Sätzen ohnehin wenig ergiebig.) Vielmehr ist zu erwarten, daß sich die Eigenschaften von F1-Sätzen durch minimale Ergänzung der Regeln für F2-Sätze ergeben.

### **8 Vorderfeld**

Wir haben für Deklarativsätze das Schema (48) erarbeitet:

$$(48)\quad K^{-\text{f}}V > (KM^\*) > (^iV^\*)$$

(Dasselbe Schema erfüllen direkte Ergänzungs-Interrogativsätze und ein Teil der Imperativsätze, wie wir in 4. gesehen haben.) Dieses Schema unterscheidet sich von dem für direkte Entscheidungs-Interrogativsätze (und einen Teil der Imperativsätze) dadurch, daß vor dem finiten Verb eine Konstituente *K* steht; vgl. (51):

$$(51) \quad ^\text{fV} > (\text{KM}^\*) > (^\text{iV}^\*)$$

Von dem Schema für E-Sätze unterscheidet es sich wesentlich dadurch, daß das unabhängige Verb vor beliebig vielen Konstituenten *KM* und vor eventuell vorhandenen infiniten Verben steht; vgl. (88):

$$(88)\quad (C) > (KM^\*) > (\text{\textquotedblleft}V^\*)^{\text{\textquotedblleft}V^\*}$$

Dies führt zu der Annahme, daß innerhalb von Deklarativsätzen vor dem finiten Verb genau eine Konstituente zu stehen habe. Diese Annahme ist unrichtig, und das Deklarativsatzschema bedarf in dieser Hinsicht der Ergänzung.

1 Topologische Felder

### **8.1 Disjunkte Konstituenten**

Wir finden Sätze wie (114):

	- b. für den Preis, dafür kriegt man auch was besseres

Hier entspricht dem *K* des Deklarativsatzschemas das *dem* in (114a) bzw. das *dafür* in (114b); davor steht jeweils noch eine Konstituente (*einem Kerl, der so was tut* bzw. *für den Preis*). Die Position, die die erste Konstituente hier innehat, symbolisiere ich durch " *KL*"; die ganze Konstruktion wird gewöhnlich als Linksversetzung (Left Dislocation) bezeichnet.

Formal eng verwandt sind Konstruktionen wie in (115), die man als Nominativus pendens bezeichnet:

	- b. so ein Preis, dafür kriegt man auch was besseres

Die Gemeinsamkeit mit der Linksversetzung besteht darin, daß die Konstituente in der Position *K* jeweils eine Anapher der Konstituente in der Position *K<sup>L</sup>* enthält (und zwar *d-*, wenn in *K<sup>L</sup>* eine Nominalphrase ist).<sup>31</sup> Der Unterschied besteht darin, daß bei der Linksversetzung die Konstituenten in *K<sup>L</sup>* und *K* im Kasus übereinstimmen, wenn *K* durch eine Nominalphrase ausgefüllt ist, bzw. in der Präposition und dem von ihr selegierten Kasus übereinstimmen, wenn *K* durch eine Präpositionalphrase ausgefüllt ist. Dem Nom. pendens fehlt diese Übereinstimmung.

Man kann mit Oertel (1923) Linksversetzung und Nom. pendens als disjunkten Gebrauch der Kasus bezeichnen. Er schreibt:

" Im normalen idg. Satze stehen die Kasus direkt zu einem andern Satzelemente in Beziehung, und diese unmittelbare enge Verschränkung kann man als konjunkten Gebrauch der Kasus bezeichnen. Wenn immer diese unmittelbare Verknüpfung gelockert ist, kann man von einem disjunkten Gebrauch der Kasus sprechen. Je nach dem Grade der Lockerung teilen


<sup>31</sup>Zur Linksversetzung werden manchmal auch Beispiele wie (i) gerechnet:

Manche Sprecher akzeptieren solche Beispiele; für viele Sprecher sind sie aber unakzeptabel oder mindestens ganz erheblich schlechter als (114) und (115). Ich lasse solche Beispiele außer acht; ebenfalls solche, wo an Stelle des Personalpronomens (*ihn*) in (a) eine Form von *d-* (*den*) steht.

sich die disjunkten Kasus in folgende drei Hauptgruppen: A. Proleptischer Gebrauch. Das Nomen hat die durch seine Beziehung auf ein anderes Satzelement geforderte Kasusform, aber die Verknüpfung ist dadurch gelockert, daß (1) ein Demonstrativpronomen das herausgehobene Nomen wieder aufnimmt […]. B. Casus pendens. Der Sprechende beginnt den Satz, noch ehe er die endgültige Form, in die der Gedanke gegossen werden soll, definitiv festgelegt hat; dabei richtet er zunächst seine Aufmerksamkeit nur auf ein einzelnes nominales Satzelement […] und fixiert dieses zunächst sprachlich im Nominativ als dem einzigen Kasus, welcher […] auch neutral (wie in Titeln, Listen) ohne syntaktische Beziehung gebraucht werden kann. Erst später wird diese sprachlich ausgedrückt und zwar am häufigsten durch ein resumptives Demonstrationspronomen" (Oertel 1923: 45)

(Die dritte Hauptgruppe ist der 'absolute Gebrauch', der im Deutschen keine wesentliche Rolle spielt.) Die Linksversetzung entspricht also Oertels proleptischem Gebrauch eines Kasus (oder allgemeiner: einer Konstituente), während der (auch von ihm (1923: 48) so genannte) Nominativus pendens dem pendenten Gebrauch entspricht. (Zum disjunkten Gebrauch von Konstituenten im Deutschen vgl. Altmann (1979) und Vat ([1980]).)

Mit der Übereinstimmung zwischen voranstehender Konstituente und Anapher beim proleptischen und ihrem Fehlen beim pendenten Gebrauch hängen weitere Unterschiede zusammen. So ist (116a) voll akzeptabel, wärend (116b) zweifelhaft oder unakzeptabel ist:

	- b. \* sein<sup>i</sup> Hund, den sollte man<sup>i</sup> anständig behandeln

Ähnlich ist die Linksversetzung (mit Kasusübereinstimmung) in (117a) einwandfrei, während der Nom. pendens in (117b) unakzeptabel ist:

	- b. \* ein Lieblingsschriftsteller, den hat jeder

Es ist bei Linksversetzungen nicht immer notwendig, daß in *K* eine Präpositionalphrase ist, wenn in *K<sup>L</sup>* eine ist. In (118) befindet sich in *K* lediglich eine lokale Anapher von *KL*; trotzdem haben die Beispiele nicht den Charakter der Inkongruenz, der für den Nom. pendens typisch ist. Dementsprechend kann auch ein gebundenes Possessivum in *K<sup>L</sup>* auftreten, parallel zu (116); in den vergleichbaren Nom. pendens-Konstruktionen (119) ist das nicht möglich:

1 Topologische Felder

	- b. in seinem<sup>i</sup> Haus, da kann jeder<sup>i</sup> machen, was er will

Allerdings müssen bei der Linksversetzung *K<sup>L</sup>* und *K* vom gleichen Typ sein. In (118) sind beide adverbiale Bestimmungen des Ortes. In (120) sind beide adverbiale Bestimmungen des Ziels bzw. des Ursprungs:

	- b. aus Dresden, da kommt Karl grade her

In (121) stimmen *K<sup>L</sup>* und *K* in dieser Hinsicht nicht überein, deshalb sind die Beispiele unakzeptabel:<sup>32</sup>

	- b. \* aus Dresden, da fährt Karl gerne hin
	- c. \* nach Dresden, da kann jeder machen, was er will

Bei der Linksversetzung könnte die Konstituente in *K* deshalb in vielen Fällen fehlen, ohne daß sich an der Akzeptabilität etwas ändern würde (wenn wir von der Intonation absehen). Aber nicht in allen Fällen ist das möglich. Wenn man in (120) die Anapher *da* ausläßt, ergeben sich die für viele Sprecher unakzeptablen Beispiele (122):

	- b. \* aus Dresden kommt Karl grade her

Wenn *K* eine Nominalphrase enthält, die nicht selbst eine Anapher ist, sondern eine Anapher von *K<sup>L</sup>* echt enthält, ist die Linksversetzung schlecht und nur der Nom. pendens möglich:

	- ii. \* (von) diesem Kerl, ein Bruder von dem arbeitet in Köln

<sup>32</sup>Bei der " gelockerten Verknüpfung", die den disjunkten Gebrauch von Konstituenten kennzeichnet, besteht ein enger intonatorischer Zusammenhang zwischen der vorangestellten Konstituente und dem Rest des Satzes. Wenn man einen starken intonatorischen Bruch nach der voranstehenden Konstituente hat, sind Beispiele wie (121) und (135b) und (140) unter gewissen Kontextbedingungen möglich. Unter solchen Bedingungen kann man nicht mehr von " gelockerter Verknüpfung" reden, sondern die so vorangestellten Ausdrücke gehören nicht zu demselben Satz; sie verhalten sich so wie die Diskurse (126) und (138) bzw. (139). (Solche Fälle gibt es natürlich auch beim Nominativ; vgl. Havers (1926).)

	- ii. dieser Kerl, ein Bruder von dem arbeitet in Köln

Wenn *K* eine Anapher enthält, können in *K<sup>L</sup>* freie Relativsätze auftreten, bei denen sonst geltende Restriktionen für den Gebrauch von freien Relativsätzen nicht zur Geltung kommen; vgl. (124) gegenüber (125):<sup>33</sup>

	- b. dem die Reporter da nachlaufen, das ist der Kommissar
	- b. \* dem die Reporter da nachlaufen, ist der Kommissar

Wegen dieser Nicht-Übereinstimmung zwischen *K<sup>L</sup>* und *K* sind solche Fälle zum Nom. pendens zu rechnen.

Einerseits sind bei der Linksversetzung also manche Konstruktionen – z. B. gebundene Possessivpronomen wie in (116) und (118) – möglich, die beim Nom. pendens ausgeschlossen sind; andererseits erlaubt der Nom. pendens Konfigurationen – z. B. solche in (123) und (124) –, die bei der Linksversetzung unmöglich sind. Manche Arten von Konstituententypen in *K<sup>L</sup>* sind nur als Linksversetzungen möglich, z. B. Präpositionalphrasen wie in (114b) und (120). Solche Fälle zeigen, daß die *KL*-Position tatsächlich zu demselben Satz wie die *K*-Position gehört und nicht als reines Diskursphänomen zu verstehen ist; denn während die Beispiele von (121) unakzeptabel sind, sind entsprechende Satzsequenzen wie (126) einwandfrei:

	- b. \* wen er dort sieht, das begrüßt er
	- b. wen er dort sieht, das weiß niemand
		- c. \* wen er dort sieht, den weiß niemand
	- b. wen er kennt, den soll er uns zeigen
	- c. wen er kennt, das soll er uns zeigen

<sup>33</sup>Die Anapher für freie Relativsätze kongruiert (außer in Kopulasätzen wie (124b)) mit dem Genus und dem Numerus des Relativpronomens; vgl. (i). Die Anapher für Interrogativsätze ist *das* wie in (ii). Die Ambiguität des Komplements in (iiia) reflektiert sich in dem Unterschied zwischen (iiib) und (iiic):

1 Topologische Felder

	- b. Hans ist grade in Dresden; da fährt er gerne hin

Bei Possessivpronomen ist es ohnehin klar, daß sie nicht innerhalb von Satzsequenzen an Ausdrücke wie *jeder* in (118b) gebunden sein können. An *man* kann ein Possessivum so wie in (116) sogar nur innerhalb desselben einfachen Satzes gebunden sein; vgl. Höhle (1978: §5.2).

Wegen der Restriktionen für Präpositionalphrasen rechne ich Fälle wie (127a) mit Präpositionalphrase in *K<sup>L</sup>* und in *K* zur Linksversetzung; solche wie (127b) mit Präpositionalphrase nur in *K* zum Nom. pendens:

	- b. daß das ungerecht ist, davon ist Karl überzeugt

Da eine Präpositionalphrase in *K<sup>L</sup>* nur bei Linksversetzung möglich ist, muß bei (127a) in *K* eine entsprechende Präpositionalphrase stehen. Aber warum ist neben (127b) nicht auch (128) möglich?

(128) \* daß das ungerecht ist, ist Karl überzeugt

Die Erklärung scheint einfach: Die Konstituente in *K* muß mit den Selektionseigenschaften des Prädikats des Satzes kompatibel sein, und bei *überzeugt sei*- muß die Angabe des Gegenstands der Überzeugung durch eine Präpositionalphrase mit der Präposition *von* ausgedrückt werden. Deshalb finden wir auch (129a), aber nicht (129b):

	- b. \* Karl ist, daß das ungerecht ist, überzeugt

Ähnliche Verhältnisse finden wir beim Prädikat *stolz sei-*:

	- b. \* daß die Partei gewonnen hat, (das) ist er stolz

b. \* Karl ist, daß die Partei gewonnen hat, sehr stolz

Dementsprechend finden wir auch (132):

	- b. Karl ist stolz darauf, daß die Partei gewonnen hat

Überraschenderweise ist daneben aber auch (133) möglich:

	- b. Karl ist stolz, daß die Partei gewonnen hat

In gewissen Fällen kann der Gegenstand der Überzeugung bzw. des Stolzes also auch einfach durch einen *daß*-Satz angegeben werden ohne eine Präpositionalphrase mit *von* bzw. *auf*. Dies könnte den Erklärungsversuch für (128)–(131) in Zweifel ziehen. Wir kommen darauf in 9. [X, s. Anm. S. 4] zurück.

Wenn Beispiele vom Typ (127b) zum Nom. pendens gehören, gilt auch für diese Konstruktion, daß die Konstituente in *K<sup>L</sup>* in einem gewissen Maß den Selektionseigenschaften des Prädikats genügen muß. So ist der *daß*-Satz in (127b) einwandfrei, und ein Interrogativsatz an seiner Stelle ist ausgeschlossen:

(134) \* ob das ungerecht ist, davon ist Karl überzeugt

Bei dem Prädikat in (135) ist dagegen ein Interrogativsatz möglich und ein *daß*-Satz schlecht:

(135) a. ob das ungerecht ist, darüber sind wir verschiedener Meinung b. \* daß das ungerecht ist, darüber sind wir verschiedener Meinung

Offensichtlich hängt das damit zusammen, daß (129a) bzw. (136) genauso wie (127b) bzw. (135a) möglich ist, während (137) genauso wie (134) unmöglich ist:


Damit gilt auch für den Nom. pendens, daß er nicht als reines Diskursphänomen zu verstehen ist. Denn innerhalb von Satzsequenzen gelten diese Selektionsbeschränkungen nicht:

	- b. Karl behauptet, daß das ungerecht ist; darüber sind wir aber verschiedener Meinung

In der Sequenz (138a) kann sich das *davon* auf den vorhergehenden *ob*-Satz 'beziehen', und in der Sequenz (138b) kann sich das *darüber* auf den vorhergehenden *daß*-Satz 'beziehen'; eben jene Bezüge sind in (134) und (135b) nicht möglich.

Ähnliche Zusammenhänge zeigen sich bei Anaphern von infiniten Verben. Bei Satzsequenzen sind Fälle wie (139) möglich, wo sich das *das* auf ein Partizip (139a), einen einfachen Infinitiv (139b) oder auf einen Infinitiv mit dem Präfix *zu* bezieht (139c):

	- b. Karl sollte doch arbeiten das hat er noch nie

1 Topologische Felder


Entsprechende infinite Verben in der *KL*-Position sind nur möglich, wenn sie die Selektionseigenschaften des jeweils regierenden Verbs erfüllen, vgl. (140) gegenüber (141):

	- b. \* arbeiten, das hat er noch nie
	- c. \* zu verurteilen, das wird er auch
	- d. \* zu arbeiten, das müßte er gar nicht
	- b. gearbeitet, das hat er noch nie
	- c. verurteilt, das wird er auch
	- d. arbeiten, das müßte er gar nicht

Hier ist nicht klar, ob das infinite Verb in (141) pendent oder proleptisch gebraucht ist. Mindestens ist jedoch zu schließen, daß keine infinite Verbform – auch nicht der einfache Infinitiv – in gleicher Weise eine neutrale Form darstellt, wie es der Nominativ ist, der bei eindeutig pendentem Gebrauch wie in (115) und (123b) auftritt.

In anderer Hinsicht teilt die Konstruktion in (141) mit der Anapher *das* in *K* jedoch Eigenschaften mit Diskursen. So kann das *das* sich häufig nicht auf ein Verb allein beziehen, wenn es mit einem (kasuellen oder präpositionalen) Objekt konstruiert ist; vgl. (142i) mit (142ii):

	- b. \* befürchten, das müßte er die Wahlniederlage nicht
	- c. \* entwischt, das ist er leider nur dem ersten Verfolger
	- d. ausweichen, das konnte ich (\*dem Verrückten) nicht
	- ii. a. Karl besteht auf seiner Forderung \*das sollte er darauf besser nicht
		- b. Karl befürchtet eine Wahlniederlage \*das müßte er sie nicht
		- c. er möchte den Verfolgern entwischen \*das ist er leider nur dem ersten Verfolger
		- d. du hättest dem Kerl ausweichen sollen das konnte ich (\*dem Verrückten) nicht

Ohne Anapher, mit dem infiniten Verb in der *K*-Position, sind entsprechende Beispiele dagegen möglich:<sup>34</sup>

	- b. befürchten müßte er die Wahlniederlage nicht
	- c. entwischt ist er leider nur dem ersten Verfolger
	- d. ausweichen konnte ich dem Verrückten nicht

Die Parallelität zwischen der *KL*-Position und Diskursen gilt auch z. B. für Ausdrücke wie *jed-* und *kein-*. Keine Anapher kann sich auf sie beziehen, wenn sie in *K<sup>L</sup>* oder in einem vorangehenden Diskursabschnitt stehen:

	- b. i. \* jeder, der bezahlte seine Rechnung
		- ii. \* keiner, der protestierte

Offenbar wirken also beim disjunkten Gebrauch von Konstituenten zwei Arten von Wohlgeformtheitsbedingungen zusammen. Erstens muß die Konstituente in *K<sup>L</sup>* (wie natürlich auch die in *K*) in gewisser Weise den Kookkurrenzrestriktionen der relevanten Konstituenten nach der *K*-Position genügen; vgl. (135) und (140)/(141). Zweitens müssen die Restriktionen erfüllt sein, die auch innerhalb von Diskursen für den Gebrauch von Anaphern gelten; vgl. (142)/(143) und (144). Es ist beachtenswert, daß diese zweite Bedingung in Beispielen wie (116a), (117a), (118b) erfüllt ist; bei den Diskursen in (145) kann man *ihn* in (145a) als Anapher

	- b. weniger zu arbeiten, das hat Karl versprochen
	- c. Karl wollte doch weniger arbeiten das hat er jedenfalls versprochen

Andere wie *sich weiger-* lassen *das* dagegen in keinem von beiden Fällen zu:

	- b. \* weniger zu arbeiten, das hat Karl sich strikt geweigert
	- c. Karl sollte doch weniger arbeiten \*das hat er sich strikt geweigert

Im Unterschied zwischen (i) und (ii) schlagen sich Unterschiede zwischen den Kookkurrenzeigenschaften der Prädikate nieder; diese wirken sich – ähnlich wie bei (139)/(141) gegenüber (142) – auf die Verwendungsmöglichkeiten im Diskurs und die Möglichkeit einer *KL*-Position aus.

<sup>34</sup>Ähnliches findet sich bei Ergänzungssätzen. Viele Verben lassen *das* als Anapher für Diskurse und für die *KL*-Position zu; etwa *versprech-* in (ib) und (ic):

1 Topologische Felder

von *seinen Hund*, *den* in (145b) als Anapher von *einen Lieblingsschriftsteller* und *da* in (145c) als Anapher von *in seinem Haus* verstehen:<sup>35</sup>

	- b. Karl hat einen Lieblingsschriftsteller den hat doch jeder
	- c. in seinem*<sup>i</sup>* Haus kann jeder*<sup>i</sup>* machen, was er will da kann man sogar Stinktiere züchten

Wie bei (141) ist auch bei anderen Fällen offen, ob die Unterscheidung zwischen pendentem und proleptischem Gebrauch sinnvoll anzuwenden ist. Bei (146) steht in *K<sup>L</sup>* jeweils ein Konditionalsatz und in *K dann* bzw. *so*; beide Elemente kann man als Anapher des Konditionalsatzes verstehen, etwa mit der Bedeutung von " unter dieser Bedingung":

	- b. will er nachdenken, so macht er das Radio an

Auch in (147) kann man die Konstituente in *K* – *diesen Fehler* bzw. *so dumm* – als Anapher der Konstituente in *K<sup>L</sup>* – des infiniten Satzes – auffassen:

	- b. sich um diesen Posten zu bewerben, so dumm war Karl nicht

Allerdings sind dies nicht 'reine' Anaphern, sondern Ausdrücke, die zugleich in einem prädikativen Verhältnis zu dem infiniten Satz in *K<sup>L</sup>* stehen. Mit den typischen Linksversetzungskonstruktionen hat (147) keine Ähnlichkeit.

In (148) kann man das *desto* bzw. *umso* als Anapher des mit *je* beginnenden Satzes in *K<sup>L</sup>* betrachten:

	- b. \* keinen Lieblingsschriftsteller, den hat doch jeder

<sup>35</sup>Bei derartigen " identity of sense"-Anaphern sind unter gewissen Bedingungen, die in Beispielen wie (144a-ii) nicht erfüllt sind, auch Antezedenskonstituenten mit *kein-* möglich. Vgl. (i), wo man *den* als *einen Lieblingsschriftsteller* verstehen kann:

<sup>(</sup>i) angeblich hat Karl keinen Lieblingsschriftsteller – den hat doch jeder!

Da diese Bedingungen in der *KL*-Position nie erfüllt sind, sind entsprechende Konstituenten dort genau wie in (144b-ii) unmöglich:

	- b. je öfter sie ihren Nachbarn begegnet, umso seltener grüßt sie sie
	- c. je weniger Autos dort fahren, desto teurer werden die Grundstücke

Ähnlich wie bei (123) ist die Anapher in der Konstituente in *K* echt enthalten.

Offenbar kann man die *KL*-Position iterieren, derart daß jede derartige Konstituente eine Anapher der vorhergehenden enthält:

	- b. dieser Kerl, dessen Freundin, mit der habe ich neulich gesprochen
	- c. dem die Reporter da nachlaufen, der Kerl, das ist der Kommissar

In (149a) haben wir in erster Position einen Nom. pendens und in zweiter Position eine Linksversetzung; bei (149b) ist in erster und in zweiter Position ein Nom. pendens. Wenn man als Linksversetzung nur Fälle mit 'reiner' Anapher betrachtet, sind derartige Iterierungen bei ihr ausgeschlossen aufgrund der bei (123) besprochenen Beschränkung.

Nach diesen Erörterungen ist das Deklarativsatzschema (48) durch (150) zu ersetzen:

(150) (*KL*\*)⌢*K* ⌢fV*>*(*KM*\*)*>*( <sup>i</sup>V\*)

Dabei müssen, wenn eine oder mehrere *KL*-Positionen gefüllt sind, *K* und *K<sup>L</sup>* eine Anapher der Konstituente in der unmittelbar vorhergehenden *KL*-Position echt oder unecht enthalten. Sätze, die dieses Schema erfüllen, nenne ich wie bisher F2-Sätze.

### **8.2 Satzanknüpfung**

Man kann F2-Sätze auf verschiedene Weise mit anderen Sätzen verknüpfen. Eine Möglichkeit ist die Asyndese wie in (151a); eine zweite die Verwendung von Partikeln wie *und, oder, aber, doch, sondern* in (151b)–(151f):

	- b. Karl füttert den Hund, und Maria füttert die Katze
	- c. Karl füttert den Hund, oder Maria füttert die Katze
	- d. Karl füttert den Hund, aber Maria füttert die Katze
	- e. Karl füttert den Hund, doch Maria füttert die Katze
	- f. Karl füttert nicht den Hund, sondern er füttert die Katze

### 1 Topologische Felder

Alle diese Verknüpfungsmöglichkeiten sind aus anderen Kontexten (wo sie Satzbestandteile verknüpfen) als koordinierende Verknüpfungen bekannt, und wie man es bei koordinierenden Verknüpfungen erwartet, erlauben sie Linkstilgungen wie in (152) und Gapping wie in (153):

	- b. Karl zeigt nicht seiner Tante \_\_\_, sondern er zeigt seinem Onkel die Briefmarkensammlung

(Mehr über Koordinationsphänomene in X [s. Anm. S. 4].)

Da die Partikeln in (151b-f) verwendet sind, um jeweils zwei Sätze miteinander zu verknüpfen, könnte man vermuten, daß sie zwischen den verknüpften Sätzen stehen und nicht mit einem der verknüpften Sätze eine Einheit bilden. Dies scheint z. B. Nordmeyer zu meinen:

(154) " Konjunktionen sind bekanntlich weiter nichts als Wörter, welche Sätze mit einander verbinden oder deren Verhältnis zu einander angeben […]. Sind sie aber wirklich nichts anderes, so folgt daraus ganz unabweisbar, daß sie nicht Teile der Sätze sind, welche von ihnen eingeleitet werden, daß sie sich also nicht in sondern vor denselben befinden." (Nordmeyer 1883: 4)

(Ähnlich Drach 1937: 35ff.) Die hier versuchte Deduktion ist jedoch nicht erfolgreich. Aus der satzverknüpfenden Funktion der Partikeln folgt keineswegs, daß sie außerhalb der von ihnen verknüpften Sätze stehen. So ist hinsichtlich der Satzverknüpfungsfunktion kein markanter Unterschied zwischen *und* und *obendrein* zu erkennen; trotzdem verhält sich *obendrein* völlig anders als *und*:

(155) a. \* Karl füttert den Hund, obendrein Maria füttert den Kater b. Karl füttert den Hund, obendrein füttert Maria den Kater

Und neben der Verwendung von *doch* in (151e) gibt es die Verwendung in (156a), wo *doch* offenbar in der *K*-Position steht; dieselbe Position hat das – zweifellos satzverknüpfende – *noch* in (156b) inne (und *noch* kann nicht wie *doch* in (151e) vor der *K*-Position stehen):

(156) a. Karl füttert den Hund, doch füttert niemand die Katze b. Karl füttert weder den Hund, noch füttert er die Katze

Außer der Position des *aber* in (151d) sind auch die Positionen in (157) möglich:<sup>36</sup>

	- b. Karl will den Hund füttern, Maria will ihn aber auch füttern

Auch hier ist kein markanter Unterschied in der Satzverknüpfungsfunktion der *doch* in (151e) und (156a) oder der *aber* in (151d) und (157) zu erkennen, und wieso das *noch* von (156b) diese (und nur diese) Position innehaben kann, ist aus seiner Funktion nicht ohne weiteres zu schließen. Offenbar ist es nicht möglich, die topologischen Eigenschaften der Partikeln von (151) allein aufgrund ihrer satzverknüpfenden Funktion zu erschließen. Wenn man mit Drach (1937: 36) den Partikeln von (151) einen " besonderen Bewußtseinsinhalt" zuspricht, ist diese spezielle Eigenschaft offenbar aus ihrem topologischen Verhalten erschlossen, nicht umgekehrt.

Was man an (151) sieht, ist, daß diese Partikeln nicht die Position *K* einnehmen. Daraus folgt jedoch nicht, daß sie nicht zu demselben Satz wie die nachfolgende *K*-Position gehören. Auch die Position *K<sup>L</sup>* steht vor der *K*-Position und gehört doch, wie wir gesehen haben, zu demselben Satz wie sie.

Ein Indiz dafür, daß diese Partikeln Teil des zweiten Satzes sind, ergibt sich aus parenthetischen Sätzen wie (158):

	- b. Karl hat aber das weißt du vielleicht schon gestern den Hund gefüttert
	- c. Karl muß oder vielleicht sollte ich besser sagen: er darf den Hund füttern

Es besteht kein Zweifel, daß *und*, *aber*, *oder* hier jeweils Teil des parenthetischen Satzes sind, und sie haben innerhalb dieser Parenthesen genau dieselben topologischen Eigenschaften wie in (151). Der Schluß ist unvermeidbar, daß die Partikeln von (151) innerhalb von Deklarativsätzen eine Anfangsposition innehaben, die ich durch " KOORD" symbolisiere. Ihre Funktion nennt man vielleicht besser Anknüpfung als Verknüpfung.

<sup>36</sup>Es finden sich auch Beispiele wie (i):

<sup>(</sup>i) sicherlich füttert Karl bald den Hund; oder aber er kommt, um den Ochsen zu tränken

Diese Kombination von *oder* und *aber* fällt völlig aus dem Muster, das sich sonst beobachten läßt, und wir gehen darauf nicht ein.

### 1 Topologische Felder

Interessanterweise scheint es sonst kaum irgendwelche zwingende Evidenz dafür zu geben, daß die Partikeln Teil des angeknüpften Satzes sind. Dies macht ein Lernbarkeitsproblem deutlich: Wie kommt ein Sprecher dazu, daß er Beispiele wie (158) ohne weiteres für einwandfrei hält? Es ist kaum anzunehmen, daß derartige Sätze in den Stimulusmengen, auf deren Grundlage der Sprachlerner die Regeln für Sätze wie (151) erwirbt, nennenswert vertreten sind. Möglicherweise wird der Sprachlerner durch ein Prinzip wie (159) geleitet:

(159) Wenn ein sprachliches Element *A* die Funktion hat, sprachliche Elemente *B<sup>1</sup>* und *B<sup>2</sup>* zu verknüpfen, ist *A* immer Teil einer Konstituente *C*, die *B<sup>i</sup>* , aber nicht *B<sup>j</sup>* enthält. (*i*, *j* ∈ {1, 2})

Verknüpfende Elemente kann man logisch häufig als Ausdrücke für symmetrische Relationen zwischen den verknüpften Elementen analysieren. Dies gilt für die Partikeln von (151), aber auch für die Satzkonjunktion *während* und die gleichlautende temporale Präposition. Nach (159) haben auch bei solchen logisch symmetrischen Relationen die verknüpften Elemente *B<sup>1</sup>* und *B<sup>2</sup>* syntaktisch niemals ein gleichartiges Verhältnis zu dem verknüpfenden Element A. Es ist eine offene Frage, ob das aus tieferen Prinzipien folgt; aber es scheint eine Tatsache zu sein.<sup>37</sup>

Aus (159) folgt nicht, welches der verknüpften Elemente – *B<sup>1</sup>* oder *B<sup>2</sup>* – Teil von *C* ist. Bei den anknüpfenden Partikeln kann der Sprachlerner jedoch intonatorische Indizien benutzen. Der Satz vor der Partikel hat häufig eine Intonation, die er auch hätte, wenn kein weiterer Satz angeknüpft wäre; niemals endet ein Satz mit einer derartigen Partikel und satzschließender Intonation. Und zwischen einer solchen Partikel und dem durch sie angeschlossenen Satz ist zwar ein starker intonatorischer Bruch mit Pause möglich, aber das ist untypisch; gewöhnlich ist die Partikel vom angeknüpften Satz intonatorisch nicht abgehoben. Hinsichtlich der Intonation verhalten sich die Partikeln also zum angeknüpften Satz ganz anders als zum vorhergehenden Satz. Wenn der Sprachlerner (159) voraussetzt, ist es naheliegend, daß er diese Asymmetrie im intonatorischen Verhalten als entsprechende Asymmetrie in der syntaktischen Zugehörigkeit deutet und die

<sup>37</sup>Wenn (159) in voller Allgemeinheit gilt, wie es von einem Prinzip zu erwarten ist, das der Sprachlerner beim Aufbau seines sprachlichen Regelsystems voraussetzt, ist zu erwägen, daß es dann wohl auch für Verben als verknüpfende Elemente zu gelten hat. Ein *n*-stelliges Verb kann man als Element auffassen, das *n* Elemente (Subjekt, 'direktes Objekt', evtl. 'indirektes Objekt' usw.) miteinander verknüpft; logisch kann man es als Ausdruck einer n-stelligen Relation analysieren. Falls (159) für Verben gilt, müßte daraus folgen, daß Verben immer Teil einer Konstituente C sind, die (mindestens) eins der verknüpften Elemente (B*i*, z. B. ein Objekt) enthält und eins der verknüpften Elemente (B*j*, z. B. das Subjekt) nicht enthält.

Partikel als Teil des angeknüpften Satzes analysiert.<sup>38</sup> Dabei ist zu beachten, daß diese Analyse ohne Zuhilfenahme von (159) nicht erzwungen würde: Das intonatorische Verhalten der Partikeln wäre mit einem syntaktisch symmetrischen Verhältnis der Partikel zu vorangehendem und angeknüpftem Satz durchaus verträglich.

Es erhebt sich die Frage, in welcher Reihenfolge die Positionen KOORD und *K<sup>L</sup>* auftreten können. Aus (160) geht hervor, daß *K<sup>L</sup>* auf KOORD folgt; andere Folgen als in (160) sind nicht möglich:

	- b. (wenn man nach Hause kommt) und vor der Tür, da steht der Gerichtsvollzieher (dann ist die gute Laune hin)
	- c. (entweder stimmt das) oder dein Freund, der hat Recht
	- d. (Karl soll nicht schlafen), aber arbeiten, das soll er

Dadurch, daß KOORD hier vor der *KL*-Position desselben Satzes auftritt, ergibt sich ein weiteres Indiz dafür, daß *K<sup>L</sup>* Teil desselben Satzes wie *K* ist. Man kann aber schwerlich annehmen, daß Beispiele wie (160) in typischen Stimulusmengen so reichlich repräsentiert sind, daß sie die Sprachlerner zu diesem Schluß führen würden. Vermutlich gilt umgekehrt: Aufgrund von Indizien, die bislang nicht aufgeklärt sind, analysiert der Sprachlerner die *KL*-Position als Teil von F2- Sätzen, und ergänzend zu (159) gilt ein Prinzip (161):

(161) Im typischen Fall nimmt ein verknüpfendes Element *A* eine Position an der Peripherie von *C* ein.

Dieses Prinzip führt dazu, daß die verknüpfenden Partikeln in (151) als Anfangselemente der angeknüpften Sätze analysiert werden. Beispiele wie (157) müssen dann als untypische Fälle aufgefaßt werden; der Erwerb der für sie geltenden Regeln ist nur aufgrund geeigneter Beispiele in der Stimulusmenge möglich. Beispiele wie (156) sind mit (161) voll kompatibel; allerdings stehen die Konjunktionen hier nicht in der KOORD-Position, sondern in der *K*-Position. Dies ist für den Sprachlerner leicht erkennbar, wenn er entsprechend den Überlegungen

<sup>38</sup>Genau das gleiche gilt für die Koordination von Satzbestandteilen, etwa Nominalphrasen: Die koordinierenden Partikeln sind Teil des angeknüpften Bestandteils. Im Japanischen sind die entsprechenden Partikeln Teil der vorangehenden Nominalphrase. (Satzanknüpfende koordinierende Partikeln gibt es im Japanischen nicht; vgl. Kuno (1973: §8).) Zweifellos hängt das damit zusammen, daß das Japanische zur Markierung syntaktischer Funktionen (fast) ausschließlich postpositionale Partikeln verwendet. Dies spricht für die Verwandtschaft zwischen koordinierenden Partikeln und Satzkonjunktionen sowie (zu Nominalphrasen tretenden) Adpositionen und für die Korrektheit von (159).

1 Topologische Felder

von 7.2 die Regeln für einfache Sätze vor den Regeln für komplexe Sätze erwirbt. Daß ein satzanknüpfendes Element wie *obendrein* nicht wie in (155) auf die *K*-Position beschränkt ist (sondern auch in einer *KM*-Position auftreten kann), ist vermutlich ähnlich wie das Verhalten von *aber* in (157) nur aufgrund positiver Beispiele erkennbar.

Nach diesen Beobachtungen ist das Schema (150) durch (162) zu ersetzen:

(162) (KOORD)⌢(*KL*\*)⌢*K* ⌢fV*>*(*KM*\*)*>*( <sup>i</sup>V\*)

Dabei kann die Position KOORD von den koordinierenden Konjunktionen eingenommen werden, die in (151) auftreten. Sätze, die dieses Schema erfüllen, sollen weiter F2-Sätze heißen.

Es ist beachtenswert, daß es darüber hinaus weitere Partikeln gibt, die in KOORD auftreten können. Die bekannteste ist *denn* wie in (163):

(163) (Karl spielt mit der Katze) denn (mit dem Hund) mit dem spielt Heinz

Diese Partikel ist mit keiner satzanknüpfenden koordinierenden Partikel kombinierbar und nimmt genau ihre Stelle ein. Sie kann aber nicht selbst zu den koordinierenden Konjunktionen gerechnet werden, aus zwei Gründen. Erstens finden wir *denn* sonst niemals in koordinierender Funktion; *denn* verknüpft keine Satzbestandteile. Selbst die Anknüpfung eines F2-Satzes an einen anderen F2- Satz mittels *denn* scheint schlecht zu sein, wenn diese Verknüpfung von F2-Sätzen eingebettet – also echter Bestandteil eines Satzes – ist; vgl. die eingebetteten Beispiele mit *denn* in (164) mit den uneingebetteten in (165) und mit den eingebetteten mit *und* in (166):

	- b. \* daß Karl glaubt, die Temperatur müsse steigen, denn die Tage würden länger, wissen wir alle
	- b. die Temperatur muß steigen, denn die Tage werden länger
	- b. daß Karl glaubt, die Temperatur müsse steigen und die Tage würden länger, wissen wir alle

Zweitens sind bei Satzanknüpfungen mittels *denn* keinerlei Linkstilgungs- oder Gapping-Phänomene möglich, die man bei einer koordinierenden Konjunktion erwarten würde:

(167) a. \* Karl füttert \_\_\_, denn Maria tränkt die Katze b. \* Karl füttert die Katze, denn Maria \_\_ den Hund

Viele Sprecher verwenden *außer* wie in (168):

(168) Karl geht jeden Sonntag zur Kirche, außer er hat was besseres vor

Der durch *außer* angeknüpfte F2-Satz hat semantisch den Charakter eines Konditionalsatzes, nicht eines Deklarativsatzes. Die Konstruktion hat manche weiteren Besonderheiten, und es ist nicht ganz klar, ob *außer* wirklich die KOORD-Position einnimmt, wie es in (168) der Fall zu sein scheint.

Manche Sprecher können *als* wie in (169) verwenden:

(169) es ist mir lieber, wir gehen nach Hause, als wir werden verprügelt

Es scheint, daß hier der F2-Satz *wir werden verprügelt* durch *als* an den F2-Satz *wir gehen nach Hause* angeknüpft wird und daß *als* die KOORD-Position innehat. Wie in (168) haben die F2-Sätze auch hier den semantischen Charakter von Konditionalsätzen, und es ergeben sich zahlreiche Fragen, die in das komplizierte Gebiet der Komparationskonstruktionen hineinführen. Ich will diese und andere sich aufdrängende Fragen hier nicht verfolgen.

Wir haben festgestellt, daß *K<sup>L</sup>* und KOORD Positionen sind, die zu demselben einfachen Satz gehören wie die darauf folgende *K*-Position. Die Sequenz " (KOORD)⌢(*KL*\*)⌢*K*" in (162) will ich als Vorderfeld bezeichnen. Diese Bezeichnung ist nicht allgemein üblich.<sup>39</sup> Das liegt zum Teil einfach daran, daß die *KL*-Position in der Literatur nicht viel Beachtung gefunden hat und die KOORD-Position häufig nicht als Teil des Satzes betrachtet wird. In gewissem Maße ist das auch verständlich. Zwar können in F2-Sätzen, wie wir gesehen haben, erheblich mehr Konstituenten im Vorderfeld stehen als die eine Konstituente in *K* – und ob und in welchem Sinne dort genau 1 Konstituente steht, ist noch zu überprüfen –, aber die anderen Konstituenten sind (i) fakultativ und (ii) in ihrer Art und in ihrem Verhältnis zueinander außerordentlich scharf restringiert, und in völlig anderer Weise restringiert, als es die Konstituenten *KM* vor dem Verb am Ende des Satzes sind. Es ist durchaus angemessen, wenn man die Position *K* als den wesentlichen Teil des Vorderfelds von F2-Sätzen betrachtet.

(wird fortgesetzt) [s. Anm. S. 4]

<sup>39</sup>Zur Geschichte der üblichen " Feld"-Terminologie und zu ihrem Verhältnis zu meinen terminologischen Vorschlägen vgl. X [s. Anm. S. 4].

### **Literatur**


*posium* (The child psychology series. Experimental and theoretical analyses of child behavior), 153–186. New York: Academic Press.


Frege, Gottlob. 1899. *Über die Zahlen des Herrn H. Schubert*. Jena: H. Pohle.


*ser Lehre in den Grammatiken der griechischen, deutschen, lateinischen, französischen und hebräischen Sprache*. Hannover: Hahn'sche Hof-Buchhandlung.


## **Part II Selected papers**

### **Chapter 2**

## **Empirische Generalisierung vs. ,Einfachheit'. Zur Zuordnung zwischen formalen und logischen Eigenschaften von Sätzen im Deutschen**

Tilman N. Höhle

### **0 Einleitung<sup>∗</sup>**

Eine Grammatik G<sup>i</sup> einer natürlichen Sprache L<sup>i</sup> soll (mindestens) die Sätze von L<sup>i</sup> aufzählen. Jeder Satz S<sup>i</sup> von L<sup>i</sup> soll durch G<sup>i</sup> eine phonologische Charakterisierung und eine logische Charakterisierung (LC) erhalten. Dabei unterliegt G<sup>i</sup> verschiedenen Adäquatheitsbedingungen; u. a. soll G<sup>i</sup> *deskriptiv adäquat* sein, d. h. die in L<sup>i</sup> vorhandenen Regularitäten als solche zum Ausdruck bringen.

<sup>∗</sup>Dies ist eine leicht erweiterte Fassung des ersten Teils des Vortrags, den ich auf dem Kolloquium 'Empirische Rechtfertigung von Syntaxen' gehalten habe. Ich danke den Teilnehmern des Kolloquiums, besonders H.-H. Lieb und A. v. Stechow, für ihre Anmerkungen. – Im zweiten Teil des Vortrags, der hier nicht repräsentiert ist, ging es – in Explikation von Höhle (1978: 17 Fn. 1) – darum, daß es im Deutschen wegen der Existenz von Ellipsen wie bei *vorles-* (cf. *er hat (ihr) (etwas) vorgelesen* keine allgemeine Zuordnungsfunktion zwischen Konstituenten und zugeordneten Argumentstellen geben kann.

Tilman N. Höhle. 2019. Empirische Generalisierung vs. ,Einfachheit'. Zur Zuordnung zwischen formalen und logischen Eigenschaften von Sätzen im Deutschen. In Stefan Müller, Marga Reis & Frank Richter (Hrsg.), *Beiträge zur deutschen Grammatik. Gesammelte Schriften von Tilman N. Höhle. Zweite durchgesehene Auflage*, 93–106. Berlin: Language Science Press. DOI:10.5281/zenodo.2588349

<sup>§</sup>*Anmerkung der Herausgeber:* Die vorliegende Arbeit erschien erstmals in Clément, Danièle (Hrsg.). 1980. *Empirische rechtfertigung von syntaxen. Beiträge zum Wuppertaler kolloquium vom 25.–29. september 1978*, 61–71. Bonn: Bouvier Verlag Grundmann. Editorische Eingriffe in den Wiederabdruck beschränken sich auf Anpassungen an das einheitliche Bandformat. (Dabei war die im Original als Fn. 1 geführte Autoren-Fn. als "\*" auszuzeichnen; entsprechend verändert sich die weitere Fn.-Zählung.)

Ich möchte an einigen Beispielen demonstrieren, daß in vielen Fällen Konflikte entstehen, wenn man (i) die Regularitäten der syntaktischen 'Oberflächenstruktur' korrekt repräsentiert und zugleich (ii) die LC eines Satzes auf – im alltäglichen Sinn des Wortes – möglichst 'einfache' Weise aus der Oberflächenstruktur gewinnen möchte. Während meines Wissens in allen Grammatiken die LC<sup>i</sup> eines Satzes S<sup>i</sup> relativ zu der syntaktischen Charakterisierung SC<sup>i</sup> formuliert wird und daher jede Grammatik in einem *formalen* Sinn eine 'Syntax' enthält, sind die oberflächenstrukturellen Regularitäten, die ich hier diskutieren will, weitgehend unabhängig von logischen Eigenschaften der Sätze; sie konstituieren dadurch einen Phänomenbereich, der in einem *inhaltlichen* Sinn 'syntaktisch' ist. Mir scheint, daß man über die 'empirische Rechtfertigung von Syntaxen' sinnvoll nur sprechen kann, wenn man diesen inhaltlich gefüllten Sinn von Syntax als eigenständigen Phänomenbereich vor Augen hat. Wenn 'Syntax' in dem rein formalen Sinn im Blick steht, daß LCs relativ zu formalen Strukturen formuliert werden, können Probleme der *empirischen* Rechtfertigung der *Syntax*, soweit ich sehe, nicht entstehen, da es dann immer nur um Fragen der 'Einfachheit' und nicht um Fragen der deskriptiven Adäquatheit geht (cf. 1.2.2).

Die Probleme, die ich ansprechen möchte, haben alle mit dem Ansatz der Kategorie " Satz" zu tun; und zwar bei Satzadverbialen, Equi-Infinitiven und A.c.I.- Konstruktionen.

### **1 Sätze mit Satzadverbialen**

### **1.1 Die** *S/S***-Analyse von Satzadverbialen**

Wir wollen, in Übereinstimmung mit einem großen Teil der Literatur, annehmen, daß uneingebettete Sätze wie (1a) und eingebettete Sätze verschiedener Art, etwa der Relativsatz in (2a), vom gleichen Kategorientyp sind, sagen wir *S*. In einer Grammatik, die einem Satz direkt eine strukturelle Repräsentation zuordnet, kann das wie in (1b) bzw. (2b) repräsentiert werden.

	- b. [S<sup>1</sup> die Männer schlafen]

Es ist nun weiterhin üblich zu sagen, daß sich Satzadverbiale wie *leider*, *angeblich*, *übrigens*, *bedauerlicherweise* usw. dadurch auszeichnen, daß sie sich mit einem *S* zu einem *S* verbinden; da solche Adverbiale in einer Kategorialgrammatik

### 2 Empirische Generalisierung

dementsprechend die Kategorie *S/S* bilden, bezeichne ich das allgemein als *S/S*-Analyse. Ein Satz wie (3a) hat nach dieser Analyse die Form (3b). (Von solchen Analysen wird z. B. in Eisenberg et al. (1975) und Eisenberg (1976) reicher Gebrauch gemacht.)

	- b. [S<sup>1</sup> [S<sup>2</sup> die Männer schlafen] leider]

Die Rechtfertigung für die *S/S*-Analyse ist semantischer Art: Nach üblicher Auffassung enthält die LC von (3a) als einen Teil die LC von (1a), d. h. mittels *leider* in (3a) wird über den Rest des Gesamtsatzes eine Aussage gemacht. Wenn wir die LC von (1a) durch (4a) andeuten, ist, nach dieser Auffassung, die LC von (3a) durch (4b) anzudeuten.

	- b. LEIDER (SCHLAF (MÄNNER))

Es liegt auf der Hand, daß der Übergang von (3a) zu (4b) – d. h. die Übersetzungsregel für bzw. die LC von Adverbialen wie *leider* – besonders 'einfach' zu formulieren ist, wenn (1a) in (3a) in derselben Weise enthalten ist, wie (1b) in (3b) enthalten ist. Wenn die *S/S*-Analyse eine empirische Hypothese über die syntaktische Form von Sätzen mit Satzadverbialen sein soll, stehen ihr jedoch mindestens 2 syntaktische Regularitäten entgegen: Verbstellung und Extraposition.

### **1.2 Anfangsstellung des Finitums**

### **1.2.1 Fakten**

Man pflegt hinsichtlich der Stellung des regierenden Verbs im Deutschen (mindestens) 3 Satztypen zu unterscheiden: Erststellung wie in (5), 'Zweitstellung' wie in (6) (Erst- und Zweitstellung kann man als 'Anfangsstellung' zusammenfassen) und 'Endstellung' wie in (7) (relevante Teil-Sätze sind hervorgehoben):

	- b. fütter doch bitte den Hund!
	- c. Karl soll, *ist er erst mal gesund*, die Hunde füttern
	- b. deshalb habe ich die These, *Karl verstehe diese Behauptung*, noch nie geglaubt
	- c. wenn Berta nach Hause kommt und *der Gerichtsvollzieher steht vor der Tür*, dürfte sie einen ziemlichen Schreck kriegen

	- b. Karl behauptet, *den Hund füttern zu wollen*

Mit dem Ausdruck " Zweitstellung" ist gemeint, daß in Sätzen wie (6) vor dem finiten Verb (V<sup>f</sup> ) genau eine Konstituente steht. Diese Erklärung ist im Allgemeinen unproblematisch und fruchtbar. Auf die Probleme, die mit der Bestimmung " genau eine Konstituente" zusammenhängen, will ich hier nicht eingehen; sie sind für unsere Zusammenhänge irrelevant. Wichtig ist dagegen, was mit der Formulierung " vor Vf" gemeint ist. In (6a) ergibt sich kein Problem; da (6a) die Form (6a') hat, steht das V<sup>f</sup> *füttert* in S<sup>1</sup> zweifellos an zweiter Stelle nach der ersten Konstituente. Ein Problem ergibt sich jedoch bei Sätzen wie (8a).

	- b. [S<sup>1</sup> leider [S<sup>2</sup> [V <sup>f</sup> schlafen] die Männer]]

Nach der *S/S*-Analyse hat (8a) die Form (8b). Hier steht V<sup>f</sup> ebenfalls an zweiter Stelle in *S*<sup>1</sup> , jedoch an erster Stelle im eigenen Satz *<sup>S</sup>*2. Heißt " vor Vf" soviel wie " innerhalb des Gesamtsatzes (*S*<sup>1</sup> ) vor Vf", wie (8b) es nahelegt? Oder heißt es soviel wie " innerhalb des minimalen Satzes *Sn*, in dem V<sup>f</sup> vorkommt"? Der minimale *S<sup>n</sup>* in (8b) wäre *S*2; in *S*<sup>2</sup> hat *schlafen* aber die Erststellung inne. In (6b) andererseits steht das V<sup>f</sup> *verstehe* nur in *S*<sup>2</sup> nach genau einer Konstituente (*Karl*), während es in *S*<sup>1</sup> mindestens 5 Konstituenten vor sich hat. Beim Einbettungstyp (6b) ist es belanglos für die Wohlgeformtheit von *S*2, wieviele Konstituenten in *S*<sup>1</sup> vorausgehen, vgl. (9). Belangvoll ist nur, ob in *S*<sup>2</sup> weniger (10a) oder mehr (10b) als eine Konstituente vor V<sup>f</sup> stehen:

	- d. noch nie habe ich die These, *Karl verstehe diese Behauptung*, geglaubt

Daraus muß man schließen, daß für die Interpretation von " vor Vf" der minimale *S<sup>n</sup>* relevant ist, der V<sup>f</sup> dominiert.

Dasselbe gilt, wenn der fragliche Satz nicht zu einem Substantiv (*These* in (9), (10)), sondern zu einem Verb gehört (cf. (11)).

2 Empirische Generalisierung

	- b. \* wenn er glaubt, *versteht er diese Behauptung*, irrt er sich
	- c. \* wenn er glaubt, *er diese Behauptung versteht*, irrt er sich

Ebenso ist bei eingebetteten Sätzen vom Typ (5c) mit 'Erststellung' des V<sup>f</sup> nicht *S*1 , sondern *S<sup>n</sup>* relevant (cf. (12)). Wieviele Konstituenten dem V<sup>f</sup> *hat* in *S*<sup>1</sup> von (12a) vorausgehen, ist belanglos; entscheidend ist, daß in *S*<sup>2</sup> V f an erster Stelle steht.

	- b. \* gleichwohl soll Karl, *bedauerlicherweise hat der Damm auch der Flut nicht widerstanden*, einen Orden erhalten

(12b) ist offensichtlich genau deshalb unakzeptabel, weil diese Regularität nicht beachtet ist. Dies ist jedoch mit der *S/S*-Analyse von *bedauerlicherweise* nicht vereinbar, denn nach ihr stände *hat* in (12b) an erster Stelle eines *S*3. Wie (12b) nach der *S/S*-Analyse akzeptabel sein sollte, wäre auch zu erwarten, daß (13a) akzeptabel ist, da das V<sup>f</sup> *schlafen* an zweiter Stelle in *S*<sup>2</sup> stände; statt dessen ist (13b) akzeptabel, wo V<sup>f</sup> an erster Stelle steht, wenn *bedauerlicherweise* zur Kategorie *S/S* gehört.

	- b. bedauerlicherweise schlafen die Männer

Wenn die *S/S*-Analyse andererseits behauptet, daß für die Stellung des V<sup>f</sup> nicht der eigene *Sn*, sondern der Gesamtsatz *S*<sup>1</sup> ausschlaggebend ist, hätte sie zu klären, wie der Akzeptabilitätsunterschied zwischen (12a) und (12b) zustande kommt und wieso in (9)–(11) genau dieselben Verhältnisse wie in uneingebetteten Sätzen bestehen, cf. (14).

	- b. \* versteht Karl diese Behauptung
	- c. \* Karl diese Behauptung versteht

### **1.2.2 Folgerung**

Da die *S/S*-Analyse mit diesen Fakten nicht verträglich ist, muß sie fallengelassen werden. Da Satzadverbiale sich hinsichtlich der Stellung des V<sup>f</sup> genauso verhalten wie *bona fide*-Satzgenossen des V<sup>f</sup> – etwa Objekte und Subjekte – sind sie als Satzgenossen von V<sup>f</sup> zu analysieren; dies sei (willkürlich) als '*ADV*-Analyse' bezeichnet.<sup>1</sup>

Es ist wichtig zu erkennen, daß die Begründungen für die beiden konkurrierenden Analysen völlig verschiedenen Status haben. Die in der *ADV*-Analyse postulierte Konstituentenstruktur stützt sich auf eine empirische Generalisierung, die eine Aussage über den formalen Aufbau von Sätzen macht. Die in der *S/S*-Analyse postulierte Struktur dagegen hat mit empirischen Generalisierungen, gar über die Form von Sätzen, nicht das geringste zu tun; ihre einzige Begründung ist der Wunsch, die Zuordnung zwischen der logischen und der syntaktischen Charakterisierung der Sätze möglichst 'einfach' zu formulieren. Davon abgesehen, daß der untechnische Einfachheitsbegriff höchst problematisch und möglicherweise gar nicht in nützlicher Weise explizierbar ist, kann er nur beim Vergleich mehrerer Theorien angewendet werden, die empirisch – d. h. vor allem auch: hinsichtlich ihrer deskriptiven Adäquatheit – gleichwertig sind. Das ist bei der *S/S*-Analyse gegenüber der *ADV*-Analyse offensichtlich nicht der Fall.

Ganz allgemein ist damit zu rechnen, daß die Zuordnung zwischen LC und SC beliebig komplex sein kann, da der Ansatz der SC auf empirischen Generalisierungen vom Typ (15) aufbaut, während die Form der LC – die im übrigen weitgehend beliebig eingerichtet werden kann – für den Aufbau der SC allenfalls Einfachheitsargumente anbieten kann (die im Zweifelsfall irrelevant sind).<sup>2</sup>

### **1.3 Extraposition**

Ein Phänomen, das für die Analyse von Satzadverbialen wie für die Analyse von Equi- und A.c.I.-Konstruktionen besonders interessant ist, ist die sog. Extraposi-

<sup>1</sup>Der Fall eines Verstoßes gegen die in (15) angenommene Zweitstellungsregularität, der gewissermaßen komplementär zur *S/S*-Analyse ist, findet sich in Eisenberg (1976: 131). Dort bilden koordinierte NPs wie *Karl und Kurt* in *Karl und Kurt sind müde* nicht eine Konstituente, sondern vor dem V<sup>f</sup> *sind* sollen hier 3 Konstituenten stehen. Auch hier kann für den Verstoß gegen die Regularität allenfalls der (irrelevante) Grund angeführt werden, daß unter dieser Analyse die Zuordnung zwischen SC und LC des Satzes – in dem gewählten Übersetzungssystem! – besonders 'einfach' ist.

<sup>2</sup> In Eisenberg (1976: 158–160) wird z. B. *zweihundert Meter* in *der Zug ist zweihundert Meter lang* als eine Konstituente analysiert, die nicht als ganze übersetzt wird; vielmehr entsprechen ihre Bestandteile völlig verschiedenen Teilen der LC.

### 2 Empirische Generalisierung

tion. Damit ist die Erscheinung gemeint, daß ein Element *E<sup>i</sup>* – besonders ein Satz –, das in einem gewissen Sinn zu einem Satz *S<sup>j</sup>* oder zu einem Element *E<sup>j</sup>* von *S<sup>j</sup>* gehört, im Nachfeld von *S<sup>j</sup>* steht.

Relativsätze etwa stehen typischerweise entweder am Ende der NP, auf die sie sich 'beziehen' (cf. (16a)), oder am Ende (= im Nachfeld) des Satzes, in dem sich ihre Bezugs-NP befindet (cf. (16b)), nicht aber etwa, dissoziiert von der Bezugs-NP, im Mittelfeld (cf. (16c)).

	- b. [S<sup>1</sup> die Männer haben geschlafen [S<sup>2</sup> *von denen du gesprochen hast*]]
	- c. \* [S<sup>1</sup> die Männer haben [S<sup>2</sup> *von denen du gesprochen hast*] geschlafen]

Es ist bekannt, daß die Extraposition (in den klaren Fällen) *rightward bounded* ist, d. h. das extraponierte Element *E<sup>i</sup>* kann nur am Ende des Satzes *S<sup>j</sup>* stehen, 'in den es gehört', und nicht ans Ende eines übergeordneten Satzes *Sj-m* treten (vgl. (17a) vs. (17b) und (18a) vs. (18b)):

	- b. \* [S<sup>1</sup> [S<sup>2</sup> daß die Männer schlafen] ist bekannt [S<sup>3</sup> *von denen du gesprochen hast*]]
	- b. \* [S<sup>1</sup> mir ist [S<sup>2</sup> daß die Männer schlafen] bekannt [S<sup>3</sup> *von denen du gesprochen hast*]]

Dies ist wiederum, wie die Stellungsregularitäten für regierende Verben, ein Phänomen, das in einem inhaltlichen Sinn genuin syntaktischer Art ist, da es auf logische (oder morphologische, phonologische, …) Eigenschaften der Sätze nicht zurückgeführt werden kann. Das heißt nicht, daß die Extrapositionsregularität durch eine formal ausgezeichnete 'Syntaxregel' beschrieben werden muß; sie könnte auch durch stellungs- und struktursensitive Übersetzungsregeln erfaßt werden.

Das Extrapositionsphänomen hat unmittelbare Auswirkungen auf die Analyse von Satzadverbialen. Nach der *S/S*-Analyse hat (19a) die Form (19b);

	- b. [S<sup>1</sup> [S<sup>2</sup> die Männer schlafen] leider]

ein auf *die Männer* bezogener Relativsatz sollte daher am Ende von *S*<sup>2</sup> stehen können und am Ende von *S*<sup>1</sup> unmöglich sein. Die Daten sind jedoch genau umgekehrt: (20a), das nach der *S/S*-Analyse die Form (20b) hat, ist unmöglich, während (21a), trotz der behaupteten Form (21b), akzeptabel ist:


Die Verteilung der Akzeptabilitätsurteile in (20a) vs. (21a) ist hingegen genau das, was unter der *ADV*-Analyse von Satzadverbialen zu erwarten ist.

Für alle Grammatiktypen, die syntaktische Regularitäten wie die Extraposition mittels der 'oberflächenstrukturellen' Form der Sätze zu erfassen versuchen, entstehen unter der *S/S*-Analyse kaum lösbare Probleme. Ich sehe nicht, wie auf motivierte Weise (20a) vs. (21a) erfaßt werden kann, ohne daß zugleich die Fakten von (17)–(18) unerklärbar werden.

Bei Grammatiken in der Montague-Tradition ist die Lage anders. Während eine Konstituentenstruktur, die einem Satz *S<sup>i</sup>* zugeordnet wird, etwas über die 'Form' von *S<sup>i</sup>* aussagen soll und syntaktische Regularitäten relativ zu dieser Form formuliert werden, ist ein Montaguescher Analysebaum zu *S<sup>i</sup>* lediglich eine Darstellung der Derivationsgeschichte von *S<sup>i</sup>* , einschließlich der Reihenfolge, in der die – formal weitgehend unrestringierten – Regeln der Syntax angewendet werden, um *S<sup>i</sup>* zu generieren. In einem derart flexiblen System ist es kein prinzipielles Problem, eine Regel R*<sup>i</sup>* zu formulieren, die einen *S* wie (22) mit dem *S/S leider* derart kombiniert, daß der *S* (23) resultiert (mündlicher Vorschlag von v. Stechow):


Allerdings müßte R*<sup>i</sup>* über ziemlich komplexe Informationen hinsichtlich der Abgrenzung von Mittel- und Nachfeld verfügen. Dafür sind verschiedene Möglichkeiten denkbar, aber soweit ich sehe, ist das nur dadurch auf relativ generelle Weise zu erreichen, daß quasi-transformationelle Regeln in die Derivation aufgenommen werden.

Weitgehend unklar ist mir, ob eine Grammatik vom Typ Eisenberg (1976), Eisenberg et al. (1975) die diskutierten Fakten mit einer *S/S*-Analyse vereinbaren könnte. Zum einen scheint mir, daß sie zu den Grammatiktypen gehört, die syntaktische Regularitäten – mindestens u. a. – mittels der oberflächensyntaktischen

### 2 Empirische Generalisierung

Form der Sätze zu erfassen versuchen, und die Diskussionsbeiträge von Lieb zu diesem Vortrag haben diesen Eindruck bestätigt. Unter dieser Voraussetzung halte ich die vorgetragenen Gründe gegen die *S/S*-Analyse für zwingend. Andererseits findet sich in der gesamten mir bekannten Literatur in der Tradition von Eisenberg (1976), Eisenberg et al. (1975) keine einzige explizit formulierte Syntaxregel, und an keiner Stelle wird erklärt, welcher Zusammenhang zwischen Konstituentenstrukturen, Syntaxregeln und syntaktischen Regularitäten besteht. Es ist daher, streng genommen, ganz ungewiß, wie innerhalb dieser Tradition überhaupt empirische Gründe für oder gegen den Ansatz gewisser Konstituentenstrukturen sinnvoll diskutiert werden können.

### **2 Equi-Konstruktionen**

Es ist weithin üblich, die Infinitivkonstruktionen (IKs) in (24a) und (25a) in gleicher Weise als *S* zu analysieren, so daß sie die Strukturen (24b) bzw. (25b) erhalten.

	- b. [S<sup>1</sup> Karl versuchte [S<sup>2</sup> *Heinz zu helfen*]]

Die IK in (24a) ist ein 'satzwertiger Infinitiv', der, jedenfalls in dieser Konstruktion, mit dem regierenden Verb *versuchte* kein Kohärenzfeld (cf. Bech 1955) bildet; für die meisten Zwecke ist es durchaus sinnvoll, ihr die Kategorie *S* zuzuweisen. Die IK in (25b) dagegen bildet mit *wollte* ein Kohärenzfeld. Im folgenden wende ich mich dagegen, (25b) für (25a) anzusetzen. Zuvor muß aber erklärt werden, was für (25b) sprechen könnte.

Der wesentliche Grund scheint semantischer Art zu sein: *woll-* wird logisch gewöhnlich als eine Relation zwischen einem Gegenstand und einer Proposition repräsentiert, derart daß etwa die LC von (25a) die LC von (26a) als Teil enthält. Wenn wir – von Tempus usw. abgesehen – (26b) als Übersetzung von (26a) betrachten, wäre (25a) daher etwa als (25a') zu übersetzen:

	- b. HELF (KARL, HEINZ)

Darüber hinaus muß sichergestellt werden, daß *woll-* im Sinn von *wünsch-* mit einem Verb im einfachen Infinitiv (Vei) nur dann vorkommt, wenn das Vei ein semantisch nichtleeres Subjekt selegiert (cf. (27) vs. (29)). (Das gleiche gilt für das 'inferentielle' *woll-* im Sinn von *angeb-*, *behaupt-*, das sich obligatorisch mit einem Vei verbindet; cf. (28) vs. (29).)

	- b. \* Karl will (es) regnen
	- b. Karl will krank geworden sein
	- c. \* Karl will ihr übel geworden sein
	- d. \* Karl will (es) geregnet haben
	- b. es hat geregnet

Unter diesen Voraussetzungen ist es verständlich, daß in transformationalistischen wie in primär logisch orientierten Grammatiken Strukturen wie (25b) angesetzt werden: Wenn man das latente Subjekt von *S*2, das als identisch mit dem Subjekt von *S*<sup>1</sup> gelten soll, durch eine Equi-NP-Tilgung oder durch einen äquivalenten interpretativen Mechanismus erfaßt (wodurch, unter gewissen Voraussetzungen, zugleich die in (27)–(28) gezeigten Fakten erfaßt werden können), ist *S*<sup>2</sup> in (25b) in relevanter Hinsicht identisch mit (26a), und die Übersetzung (25a') läßt sich auf sehr 'einfache' Weise aus (25b) gewinnen.

Gegen den Ansatz eines eingebetteten *S* in (25a) spricht jedoch, daß dies eine kohärente Infinitivkonstruktion (cf. Bech 1955) ist. Als eines unter mehreren Indizien soll uns hier die Beobachtung der Extraposition genügen. Wenn wir den Relativsatz in (30a) extraponieren, erhalten wir (30c) als akzeptables Resultat. Der Satz (30b), der nach der Analyse (25b) zu erwarten wäre, ist unakzeptabel. (30c) dagegen hätte gemäß (25b) die Form (30d), die ein Verstoß gegen die Extrapositionsregularität wäre. Mit der Regularität vereinbar ist die Struktur (30e), so daß auch (25a) als einfacher Satz ohne eingebetteten *S* wie in (30e) zu analysieren ist.<sup>3</sup>

<sup>3</sup>Der Unterschied zwischen satzwertigen IKs wie in (24) und kohärenten IKs kann nicht darauf zurückgeführt werden, daß in (24) ein Verb im Infinitiv mit *zu* (Vzi) vorliegt und in (25) ein V ei. Denn kohärente IKs, die sich syntaktisch in keiner relevanten Weise von der Konstruktion bei *woll-* unterscheiden, finden sich auch mit Vzi, z. B. bei *pfleg-*, *droh-*, *schein-*, *hab-*, *bleib-* und besonders bei *wiss-* (*Karl weiß eine gute Suppe zu kochen*), das wie *woll-* subjektselegierend ist und vermutlich als logisch (mindestens) 2-stellig analysiert werden muß.

### 2 Empirische Generalisierung

(30) a. daß Karl dem Jungen, *von dem wir sprachen*, helfen will, …


Evers (1975) hat das hier vorliegende Problem bemerkt und dadurch gelöst, daß er auf eine Struktur wie (25b) (i) eine 'Verb-Raising'-Regel anwendet, deren Effekt u. a. (ii) ein 'Pruning' von *S*<sup>2</sup> ist. Davon abgesehen, daß (ii) völlig willkürlich ist, bestehen Probleme, die in Höhle (1978: 86f.) genannt sind.

Lieb (mündliche Mitteilung) akzeptiert Strukturen wie (25b), schlägt jedoch vor, daß eingebettete Sätze wie *S*<sup>2</sup> in (25b), (30d) in Abhängigkeit von Matrixverben wie *woll-* hinsichtlich der Extraposition 'durchlässig' sind. Auf den ersten Blick ist dieser Vorschlag attraktiv, da er formale Ähnlichkeit mit den wohlmotivierten 'bridge conditions' von Erteschik-Shir (1973) zu haben scheint, nach denen unter gewissen semantisch/pragmatischen Bedingungen Extraktionen aus Sätzen zulässig sind, die sonst unmöglich sind. Dagegen ist einzuwenden, daß die 'bridge conditions' von Erteschik-Shir inhaltlich wohldefiniert sind, während Liebs 'Durchlässigkeitsbedingungen' für Konstruktionen mit *woll-* und A.c.I.- Konstruktionen (cf. Abschnitt 3) gelten müßten, die sich als Klasse von satzwertigen IKs wie in (24b) nicht in unabhängig relevanter Weise unterscheiden; zum anderen erklärt dieser Vorschlag nicht, warum (30d) unmöglich ist. Im übrigen gibt es eine Reihe weiterer Unterschiede zwischen satzwertigen IKs und kohärenten Konstruktionen (cf. Bech 1955; Evers 1975), die durch diesen Vorschlag in keiner Weise abgedeckt werden, aber alle unter der Annahme, daß es sich um einfache Sätze handelt, eine Erklärung finden.

Manche Probleme dieser Konstruktionen lassen sich im 'Conditions-framework' (cf. Chomsky & Lasnik 1977; Chomsky 1978; Koster 1978) leicht behandeln; der Unterschied zwischen kohärenten und inkohärenten Infinitkonstruktionen ist dort aber nicht ohne weiteres rekonstruierbar.

Wie die distributionellen und logischen Fakten auch bei einer Oberflächenstruktur wie (30e) ohne Rückgriff auf 'Tiefenstrukturen' beschrieben werden können, ist in Höhle (1978: 84f. und 173ff.) dargestellt.

### **3 A.c.I.-Konstruktionen**

Bei A.c.I.-Konstruktionen läßt sich dasselbe Argumentationsmuster wie bei kohärenten Equi-Konstruktionen anwenden; wir können die Diskussion deshalb kurz halten.

Nehmen wir an, daß Sätze wie (31) im einfachsten Fall wie (32) zu übersetzen sind. Im Interesse einer möglichst 'einfachen' Übersetzung möchte man (31) daher die Struktur (33) geben (so z. B. Eisenberg et al. 1975: 123, Chomsky & Lasnik 1977; Chomsky 1978).


Wiederum sprechen jedoch u. a. die Extrapositionsfakten gegen diese Strukturierung. Wenn wir den Relativsatz in (34a) extraponieren, erhalten wir nicht, wie nach (33) anzunehmen, (34b), sondern (34c), was nur mit einer einfachen Satzstruktur wie (34d) zu vereinbaren ist.

	- b. \* [S<sup>1</sup> daß er [S<sup>2</sup> die Steine dort liegen [S<sup>3</sup> *die er suchte*]] sah]
	- c. daß er die Steine dort liegen sah, *die er suchte*, …
	- d. [S<sup>1</sup> daß er die Steine dort liegen sah [S<sup>2</sup> *die er suchte*]]

Zur weiteren Demonstration, daß A.c.I.-Konstruktionen weitgehend nicht die Eigenschaften eingebetteter *S* haben, cf. Bech (1955); Reis (1976); Evers (1975). Allerdings haben solche Konstruktionen eine Reihe überraschender Eigentümlichkeiten, zu deren Beschreibung und Verständnis jedoch – entgegen den Voraussetzungen von Chomsky (1978); Chomsky & Lasnik (1977) – ihre Zuweisung zu einer Kategorie *S* in keiner Weise hilfreich ist (cf. Höhle 1978: 53–61). – Zur Beschreibung und Übersetzung von A.c.I.-Konstruktionen auf der Grundlage einfacher Satzstrukturen wie (34d) cf. Höhle (1978: 83f.).

### **4 Zusammenfassung**

Wir haben 3 Phänomenbereiche betrachtet, in denen die formalen und die logischen Eigenschaften von Sätzen gewissermaßen auseinanderfallen. In dreifacher Hinsicht scheint mir die Diskussion solcher Phänomene wichtig.

(i) Sie zeigen, daß Sätze mindestens zum Teil formale Eigenschaften haben, die aus ihren logischen (oder sonstigen) Eigenschaften nicht deduzierbar sind; gegenüber 'Syntax' in dem trivialen Sinn, daß die LC<sup>i</sup> eines Satzes S<sup>i</sup> in irgendeiner Weise auf eine formale Charakterisierung SC<sup>i</sup> Bezug nehmen muß, konstituiert sich dadurch ein Bereich 'autonomer' Syntax.

(ii) Die wichtige Unterscheidung zwischen dem zentralen Begriff der sprachlichen Regularität einerseits – und den damit zusammenhängenden Begriffen 'empirische Generalisierung' und 'deskriptive Adäquatheit' – und dem empirisch uninteressanten intuitiven Begriff der 'Einfachheit' andererseits tritt bei der Diskussion solcher Fälle, wie mir scheint, besonders deutlich hervor.

(iii) Es ist signifikant, daß die Generalisierungen, um die es hier ging, im wesentlichen solche der Topologie, d. h. der 'Wortstellungs'-Regularitäten sind. Insofern sich 'autonome' Syntax besonders innerhalb der Topologie manifestiert, scheint mir dieses Teilgebiet der Grammatik ganz besonders theoretisches Interesse zu verdienen.

### **Literatur**


### **Chapter 3**

## **Explikationen für "normale Betonung" und "normale Wortstellung"**

Tilman N. Höhle

### **0 Einleitung<sup>∗</sup>**

In der Topologie (Wortstellungslehre) des Deutschen kann man grob zwei Bereiche unterscheiden: Gewisse Satzbestandteile sind strengen topologischen Regularitäten unterworfen; dies gilt besonders für verbale Elemente und 'Konjunktionen', aber in hohem Maße auch für die Bestandteile von Nominal-, Präpositionalund Adjektiv/Adverbialphrasen. Insofern sind die Fakten, die in diesem Bereich zu beschreiben sind, weitgehend unstrittig. Die Positionsmöglichkeiten verschiedener Elemente – etwa NPs und PPs – innerhalb des Mittelfeldes relativ zueinander scheinen dagegen einigermaßen undurchsichtig. In vielen Fällen kann man

Für Diskussionen zu hier behandelten Themen danke ich Manfred Bierwisch, Nomi Erteschik-Shir, Hans-Peder Kromann, Oddleif Leirbukt, Jürgen Lenerz und Marga Reis. Lenerz und Reis verdanke ich eine Reihe von spezifischen Anregungen und Hinweisen für Verbesserungen.

<sup>§</sup>*Anmerkung der Herausgeber:* Diese Arbeit erschien erstmals in Abraham Werner (Hrsg.). 1982. *Satzglieder im Deutschen. Vorschläge zur syntaktischen, semantischen und pragmatischen Fundierung* (Studien zur deutschen Grammatik 15), 75-153. Tübingen: Narr. Der vorliegende Wiederabdruck ist im Wesentlichen textuell unverändert; jedoch haben wir ihn dem einheitlichen Bandformat angepasst, sowie im Interesse der Leserfreundlichkeit die Literaturverweise L1, L2, … im Text durch die entsprechenden Autorenverweise ersetzt, die Fußnoten durchgezählt (d. h. Fn. 12a/12b des Originals sind jetzt Fn. 13/14, die weiteren Fn. entsprechend versetzt) und einen Zählfehler (Sprung von Bsp. (169) zu (171)) sowie weitere kleine Mängel beseitigt. – Die als " Höhle (in Vorb.)" verzeichnete Arbeit blieb unrealisiert.

<sup>∗</sup>Dieser Aufsatz ist eine überarbeitete Fassung von Höhle (1979b). Eine frühere (und kürzere) Fassung der Abschnitte 1 und 2 ist als Höhle (1979a) erschienen. (Was ich hier als 'strukturell normal' bezeichne, habe ich in diesen früheren Fassungen 'grammatisch normal' genannt.)

weder sagen, daß eine bestimmte Wortfolge ausgeschlossen oder die einzig mögliche ist, noch, daß zwischen zwei verschiedenen möglichen Wortfolgen völlig 'freie Variation' besteht. Vielmehr wird oft gesagt, eine gewisse Wortfolge sei bei 'normaler' Betonung unmöglich, sie bedinge eine 'kontrastive' oder 'emphatische' Betonung; ähnlich wird nicht selten von 'normaler' Wortstellung gesprochen, im Unterschied etwa zu einer 'kontrastiven' oder 'emphatischen' Stellung. Damit ist explizit oder implizit oft die Ansicht verbunden, daß, diese Unterscheidung zwischen 'Normalität' und 'Nicht-Normalität' (a) innerhalb des syntaktischen Beschreibungssystems als solche zum Ausdruck kommen muß, oder gar (b) daß die 'nicht-normalen', 'markierten' Fälle gar nicht zum primären Gegenstandsbereich der Syntax gehören.

Nach meiner Kenntnis gibt es jedoch kaum irgendwo befriedigende Explikationen der Unterscheidung zwischen 'normaler' und 'nicht-normaler' Betonung und Wortstellung. Daher fehlen befriedigende Kriterien zu ihrer gegenseitigen Abgrenzung, verschiedene Autoren bewerten gegebene Beispiele verschieden, und die Relevanz einer solchen Unterscheidung ist keineswegs offensichtlich. Damit ist auch der Gegenstandsbereich und mögliche Aufbau der Syntax in diesem Bereich der Topologie unklar, und jeder Streit darüber ist müßig, solange diese Begriffe nicht geklärt sind.

Um künftigen Untersuchungen zur Topologie in dieser Hinsicht den Weg zu ebnen, versuche ich in diesem Aufsatz zu klären, inwieweit hier überhaupt sprachwissenschaftlich relevante Begriffe vorliegen, die darüber hinaus essentiell sind in dem Sinne, daß sie nicht auf unabhängig gesicherte Begriffe definitorisch zurückgeführt werden können, und im Zusammenhang damit, wie diese Begriffe zu explizieren sind. Dabei wird sich u. a. zeigen, daß man streng zwischen intuitiven Begriffen von 'stilistischer Normalität/Unmarkiertheit' und nicht-intuitiven Begriffen von 'struktureller Normalität/Unmarkiertheit' unterscheiden muß. Während die intuitiven Normalitätsbegriffe essentiell und offensichtlich relevant sind, sind die strukturellen Normalitätsbegriffe nicht essentiell und von bestenfalls zweifelhafter Relevanz.

### **1 Normalbetonung**

In den folgenden Abschnitten möchte ich zeigen, daß der Begriff 'Normalbetonung' der Klärung bedarf (1.1); daß geläufige Klärungsversuche unklar, inkonsistent oder empirisch inadäquat sind (1.2), und daß, eine adäquate Explikation in spezifischer Weise von pragmatischen Begriffen Gebrauch machen muß (1.3).

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

### **1.1 Klärungsbedürftigkeit des Begriffs**

Die Extension des Begriffs 'Normalbetonung' ist immer dann unproblematisch, wenn sie rein formal, etwa durch eine einfache Nominaldefinition, festgelegt ist. So spricht z. B. Bartsch (1976: 521ff) von " standard intonation pattern"; dies liegt immer dann vor, wenn " the intonation peak lies on the noun of the last term of the sentence". Das Problem dabei ist nur, warum eine solche Betonung als 'Standard'- oder 'Normalbetonung' ausgezeichnet werden soll. Welches empirische Interesse besteht daran, die Betonungen in (1) im Unterschied zu denen in (2) als 'normal' anzusehen (Kursivdruck steht für Betonung)?

	- b. daß der Junge dem *Pfarrer* begegnet ist
	- c. daß der *Junge* getanzt hat
	- d. daß der *Junge* kommt
	- b. daß der Junge dem Pfarrer *begegnet* ist
	- c. daß der Junge *getanzt* hat
	- d. daß der Junge *kommt*

Ähnlich uninformativ sind z. B. Ausführungen bei Kiparsky (1966: 79ff). Er schreibt zunächst (S. 79):

" Wir berücksichtigen durchaus nur die normale, affektfreie Betonung von Sätzen. Emphatische oder kontrastive Betonung lassen wir konsequent beiseite. Entgegen der Normalbetonung, die strengen Regeln unterliegt, kann diese ein beliebiges Wort des Satzes treffen und stellt daher keine besonderen Probleme."

Wie man im Zweifelsfall 'normale' von 'emphatischer' oder 'kontrastiver' Betonung empirisch unterscheiden kann, führt er nicht aus. Aus seinen für 'Normalbetonung' konzipierten Regeln kann man nur entnehmen, daß bei mehrstelligen Verben die Betonung des letzten Substantivs im Allgemeinen 'normal' sein soll. Allerdings möchte er mit seinem Regelwerk auch Fälle wie (3) erfassen (S. 91 (51)):

(3) der Arzt wird den Patienten unter*suchen*

Dies ist überraschend, denn tatsächlich kann sein Regelsystem diese Betonung nicht generieren: Dazu müßte *der Arzt wird den Patienten* eine Konstituente sein

(S. 92 (53)). Aufgrund seiner Regeln (F2) und (T1) (S. 80f) ist dies jedoch ausgeschlossen. Welche empirischen Gegebenheiten können Kiparsky veranlaßt haben, entgegen seinem eigenen Regelapparat Betonungen wie in (3) als 'normal' zu betrachten? Da keine inhaltliche Bestimmung von 'normaler' vs. 'nicht-normaler' Betonung angegeben ist, kann man diese Frage nicht einmal rational diskutieren.

Wie unklar die Identifizierung der 'Normalbetonung' ist, sieht man deutlich an den folgenden Zitaten. So schreibt Kirkwood:

	- (3) Er gab dem Kind das Buch
	- (4) Er gab das Buch dem Kind

the dative object carries contrastive stress …" (Kirkwood 1969: 86)

(Ebenso z. B. in Griesbach 1961 (IV): 85) Dabei nimmt er offensichtlich an, daß jeweils das letzte Nomen voll betont ist. Dies aber ist z. B. für Bartsch, wie wir gesehen haben, gerade ein Musterfall für 'standard intonation pattern'. (Andererseits macht sie doch zwischen solchen Beispieltypen eine Unterscheidung, die – unter einer adäquaten Explikation dieser Begriffe – der Unterscheidung zwischen normaler und kontrastiver Betonung entspricht; vgl. 1.4.4). Und für Lenerz haben nicht nur seine parallelen Beispiele (2b) und (3a) 'Normalbetonung'; er schreibt ausdrücklich:

	- (2) b) Ich habe das Geld dem *Kassierer* gegeben
	- (3) a) Ich habe dem Kassierer das *Geld* gegeben

In (2) a) ist bei der Abfolge IO DO das IO als Rhema durch den normalen Satzakzent hervorgehoben." (Lenerz 1977: 147 (43))

Dabei spielt die Unterscheidung von 'normalem' vs. 'nicht-normalem Satzakzent' bei Lenerz' Untersuchungen zu Wortstellungsregularitäten eine zentrale Rolle; vgl. z. B.:

	- (5) b) ?\*Ich schickte an einen Bewerber den *Frage*bogen
		- c) Ich schickte an einen Bewerber die UNTERLAGEN (und nicht den ABLEHNUNGSBESCHEID)

möglich." (Lenerz 1977: 66f)

In Abschnitt 1.4.3 von Lenerz (1977) weist Lenerz darauf hin, daß etliche topologische Regularitäten " nur in Sätzen mit normaler Intonation gelten" (S. 34) und daß bei 'nicht-normaler' Intonation z. T. andere Regularitäten gelten; dies ist für

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

ihn ein Grund, " auch im folgenden Sätze mit Emphase- oder Kontrastintonation weitgehend aus[zu]klammern" (S. 34). Bei der Unterscheidung dieser 3 Akzentund Intonationsarten stützt er sich auf Bierwisch (1966), den wir unten kritisieren werden.

### **1.2 Verschiedene Explikationsversuche**

Wir sehen, daß in vielen Arbeiten zur Topologie Annahmen über 'Normalbetonung' eine wichtige Rolle spielen und daß dieser Begriff klärungsbedürftig ist; man sucht nach einer empirisch signifikanten Explikation. Wir wollen kurz einige Explikationsversuche betrachten, die sich da und dort in der Literatur finden.

Gelegentlich hört oder liest man etwas wie (7):

(7) Ein Satz mit Normalbetonung ist in allen Kontexten möglich.

Es ist klar, daß eine Behauptung wie (7) abwegig ist: Es gibt überhaupt keinen Satz, der unter Wahrung konversationeller Maximen in beliebigen Kontexten geäußert werden kann. Eine Variante von (7) ist (8):

(8) " Unmarkierte Sätze: […] Normaler Satzakzent und damit keine erkennbaren Beschränkungen für Vorgänger- und Folgesätze" (Altmann 1976: 38)<sup>1</sup>

Selbst wenn man (8) in möglichst konstruktiver Weise interpretiert, ist dies keine adäquate Explikation des üblichen Sprachgebrauchs. So liegt nach Ansicht aller Autoren in (9a) normale Betonung und normale Wortstellung vor; für (9b) sind die Ansichten geteilt.

	- b. er will das Auto seinem *Freund* schenken
	- c. Karl hat gestern einen *Porsche* gekauft

Soweit nicht weitergehende kontextuelle Informationen gegeben sind, ist jedoch nur (9b), nicht aber (9a) ein möglicher Nachfolgersatz für (9c). (Wir kommen auf das Beispiel in 1.4.3 zurück).

Ein anderer geläufiger Explikationsversuch ist (10):

(10) Nur Sätze mit Normalbetonung sind als Textanfänge möglich.

Wenn man " Textanfänge" wörtlich nimmt, ist dieses Kriterium unbrauchbar, denn in empirisch vorfindlichen Textanfängen finden sich Sätze mit allen denkbaren Betonungsmustern; demnach wären alle Betonungen 'Normalbetonungen'.

<sup>1</sup>Darauf folgt der Zusatz: " Aus Gründen der leichteren Unterscheidbarkeit möchte ich teilidentische Sätze bei den Vorgängersätzen ausschließen". Falls dieser Zusatz inhaltlich relevant sein soll, kann er wohl nur die Aufhebung der zuvor gemachten Aussage beinhalten.

Vielleicht könnte man eine Theorie über 'normale Textanfänge' entwickeln, auf die (10) sich beziehen könnte; solange eine solche Theorie nicht gegeben ist, ist (10) nicht die gesuchte Explikation.<sup>2</sup>

Ein ähnlicher Explikationsversuch ist (11):

(11) Nur Sätze mit Normalbetonung können als Diskursanfänge dienen.

Wenn mit " Diskurs" alltägliche Konversation gemeint ist, ist (11) wiederum keine Explikation des tradierten Begriffs. Unter geeigneten Umständen kann ein Gespräch z. B. ohne weiteres mit der Äußerung von (12) eingeleitet werden, obwohl dies nach allgemeiner Ansicht keine Normalbetonung ist; nach (11) wären alle denkbaren Betonungen 'normal'.

(12) weißt du schon, daß *Karl* die Scheune angezündet hat?

Schmerling (1976: 50ff) diskutiert einen Explikationsversuch von Stockwell. Sie gibt folgendes Zitat von ihm:

" When utterances are elicited from an informant, certain intonation patterns regularly occur. These are citation patterns. They can be re-elicited from any number of informants with almost perfect consistency […] Such patterns may, for convenience, be labelled " normal"." (Schmerling 1976: 50)

Schmerling zeigt, daß es zumindest für eine Reihe einstelliger Verben (solche vom Typ (1d)) äußerst zweifelhaft ist, ob wirklich konsistente Befragungsergebnisse erzielt würden. Mit Recht weist sie darauf hin, daß es darüber hinaus ganz unklar ist, inwiefern kontextlosen Zitatbetonungen<sup>3</sup> irgendein sprachwissenschaftliches Interesse zukommen sollte: Natürliches Sprechen, insbesondere

(i) dein Karatelehrer hat ihr ein *Auto* geschenkt

<sup>2</sup>Darüber hinaus vermute ich, daß Proponenten einer Theorie normaler Textanfänge ein Beispiel wie (i) nicht als 'normalen Textanfang'

zulassen würden; der Satz hat aber nach allgemeiner Ansicht normale Betonung. 'Als normaler Textanfang möglich' wäre also nur eine hinreichende, keine notwendige Bedingung für normalbetonte Sätze. Vgl. Fn. 27.

Abgesehen davon bliebe natürlich fraglich, wieso man gerade die bei Textanfängen zu beobachtenden Betonungen als 'normal' in irgendeinem relevanten Sinne betrachten sollte. Soweit es eine plausible Theorie über 'normale Textanfänge' gibt (cf. Clark & Haviland 1977), ist diese keine spezielle 'Texttheorie', sondern aus derselben pragmatischen Theorie deduzierbar, auf die ich die Explikation von 'Normalbetonung' gründen möchte; d. h. die Explikation von 'Normalbetonung' mit Hilfe 'normaler Textanfänge' wäre (selbst wenn sie möglich wäre) überflüssig.

<sup>3</sup>Diesen von Stockwell benutzten Ausdruck behalte ich bei, obwohl er inadäquat ist: Die in Rede stehenden Intonationsmuster haben mit 'Zitaten' im üblichen Sinne des Wortes nichts zu tun; 'elicitation patterns' wäre ein angemessenerer Ausdruck.

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

natürliches Betonen, vollzieht sich in Kontexten. Mit welcher Berechtigung sollte dann ein offenbar theoretisch wichtiger Begriff wie 'Normalbetonung' auf die Beobachtung völlig unnatürlichen Verhaltens, nämlich des kontextlosen 'Zitierens', gegründet werden? Zumindest müßten Gründe für ein solches Vorgehen explizit diskutiert werden.<sup>4</sup> Die Berufung auf 'Zitate' zur Etablierung von 'Normalbetonung' erscheint tatsächlich so abwegig, daß man vermuten möchte, daß es Stockwell hier eigentlich nicht um die Einführung des Begriffs 'Normalbetonung' geht, sondern daß er einen prätheoretischen Begriff davon bereits hat und 'Zitatbetonungen' lediglich als ein empirisches Korrelat dafür benutzt. In jedem Fall können 'Zitate' keine Explikation von 'Normalbetonung' geben; bestenfalls bieten sie einen (mehr oder weniger zuverlässigen) 'Test', um normalbetonte Sätze als solche zu erkennen. Wir werden sehen, daß sich unter einer adäquaten Explikation verstehen läßt, was 'Zitatbetonungen' mit Normalbetonung zu tun haben.

Es ist bemerkenswert, daß alle diese Explikationsversuche in irgendeiner Weise auf Kontexte abheben. Inhaltlich sind damit, wie wir später sehen werden, solche Explikationsversuche wie (13) eng verwandt:

(13) Bei Normalbetonung wird kein Teil des Satzes besonders hervorgehoben; bei allen anderen Betonungen ist der betonte Teil hervorgehoben.

Das Problem bei dieser Formulierung ist, daß nicht klar ist, was unter " Hervorhebung" zu verstehen ist. Ist z. B. in (9b) *Freund* 'besonders hervorgehoben'? Kirkwood scheint dieser Meinung zu sein, vgl. (4); aber inwiefern ist dann *Auto* in (9a) nicht 'besonders hervorgehoben'? Immerhin kann man zu (9a) die Fortsetzung (14) bilden,

(14) … und nicht die *Melk*maschine

und da möchte man *Auto* und *Melkmaschine* wohl intuitiv als 'hervorgehoben' betrachten; gleichwohl gilt (9a) gemeinhin als 'normalbetont'. Etwas ähnliches wie (13) hat Stockwell offenbar im Sinn (und das stützt die Vermutung, daß er durchaus eine inhaltliche, von 'Zitaten' unabhängige Vorstellung von Normalbetonung hat). In dem ausgelassenen Teil des oben angeführten Zitats steht nämlich:

<sup>4</sup> Schmerling entwickelt eine Hypothese, wie die konsistenten kontextlosen Zitatbetonungen zustande kommen. Die Fakten, auf die sie sich dabei beruft, sind aber offenbar komplizierter, als sie erkannt hat, cf. Bean (1978: 956). – Unabhängig davon halte ich Schmerlings ad hoc-Hypothesen, die auf einer angeblichen 'Bedeutungslosigkeit' von 'Zitaten', d. h. isolierten Sätzen ohne natürlichen Kontext beruhen, für prinzipiell falsch, da es eine allgemeine *Erklärung* für diese Fälle gibt; vgl. 1.4.4.

"They [= citation patterns, TNH] are also heard in normal discourse, but no sampling or statistical work of any sort has been done to indicate whether such patterns are the most frequent ones or not. It is true, however, that where they are observed in normal discourse, they can be shown by questioning to carry no additional component or differential meaning beyond that which is assignable to the segmental morphemes alone." (Schmerling 1976: 50; Hervorhebung von mir)

Das Problem ist hier natürlich, zu klären, inwiefern nicht-normal betonte Sätze 'additional components or differential meaning' mit sich führen, durch die sie sich von normalbetonten Sätzen unterscheiden.

Zu den bisher besprochenen Explikationsversuchen gibt es etliche Varianten; soweit ich sehe, leiden sie alle unter ähnlichen Defekten wie die hier zitierten. Ich möchte jetzt zu zwei völlig anders gearteten Bestimmungen kommen.

Bierwisch (1966: 151ff) hält es für " notwendig, wenigstens drei Arten der Hervorhebung zu unterscheiden" (S. 151 Z. 3). Erstens " hat jeder Satz automatisch einen Primärakzent" (S. 151 Z. 5), einen " normalen Hauptakzent […]" (S. 151 Z. 14- 15). Eine inhaltliche Bestimmung gibt er nicht. Man könnte aber (wenn nicht das *wenigstens* S. 151 Z. 3 wäre) versuchen, aufgrund der Bestimmung der beiden anderen 'Hervorhebungsarten' ex negativo auch den 'normalen Hauptakzent' zu bestimmen.

(15) " Ein zweiter Typ der Hervorhebung, den wir Kontrast nennen wollen, ergibt sich, wenn zwei oder mehr Sätze mit parallelen Konstituenten, die aber mit verschiedenen Morphemen besetzt sind, aufeinander folgen."

(Bierwisch 1966: 151 Z. 17-19)

Sein Beispiel ist (16) (= Bierwisch 1966: 151 (31c)); einschlägig wäre wohl auch der Diskurs (17). Es ist nicht klar, wie Beispiele wie (18) unter


dieser Terminologie zu rubrizieren sind. Ein solcher Satz kann ohne jeden sprachlichen Kontext geäußert werden, setzt also keinen 'Kontrast' zu parallelen, aber morphologisch verschiedenen Konstituenten voraus, teilt aber mit (16) und (17) die Eigenschaft, daß mehr als 1 Konstituente voll betont ist. Nach meinem Eindruck ist Bierwischs 'kontrastive' Betonung überhaupt nur durch diese Eigenschaft von Sätzen mit 'normalem Hauptakzent' unterschieden. Es spricht nichts

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

dagegen, solche Unterschiede terminologisch auszuzeichnen, aber ich sehe andererseits nicht, welche Fakten dafür sprechen; die einfache Feststellung, daß *n* Hauptakzente gegeben sind, mit *n* = 1 bzw. *n >* 1, scheint mir völlig zureichend. (Bierwischs Motiv für die terminologische Unterscheidung allerdings scheint klar: Er geht davon aus, daß genau 1 'normaler Hauptakzent' aufgrund von Kiparskys (Kiparsky 1966) und Heidolphs (Heidolph 1970) Regeln festgelegt ist, während das für mehr als 1 'Hauptakzent' nicht gilt. Aber dies ist ein rein formaler Gesichtspunkt ohne inhaltliches Interesse. – Warum Kiparsky für 'Normalbetonung' genau 1 Hauptakzent annimmt, läßt sich allerdings unter einer adäquaten Explikation des Begriffs verstehen, cf. 1.4.4.)

Seinen dritten 'Hervorhebungstyp' bezeichnet Bierwisch als 'Emphase':


(Bierwisch 1966: 153)

Aufgrund der Angaben in (19) ist eine 'emphatische' Betonung nicht von einer 'kontrastiven' zu unterscheiden. (21a) kann als 'paradigmatische Korrektur' (gegenüber (21b) mit der Einleitung " nein, …")

	- b. (höre ich richtig?) *Heinz* hat die *Katze* geschlagen?
	- c. was denn? *Karl* hat den *Hund* geschlagen?

wie auch als Antwort auf eine 'Echofrage' (21c) (mit der Einleitung " ja, in der Tat, …") gebraucht werden und hätte insofern 'emphatische' Betonung. Zugleich enthalten (21a,b) "parallele Konstituenten, die aber mit verschiedenen Morphemen besetzt sind"; nach (15) ist die Betonung in (21a) daher 'kontrastiv'. Man kann daher allenfalls sagen, daß ein bestimmtes Akzentmuster für verschiedene kommunikative Zwecke eingesetzt wird: Einmal zur 'Kontrastierung' im Sinne von

(15), einmal als Antwort auf eine Echofrage, und einmal als 'paradigmatische Korrektur'. Aber inwiefern die verschiedenen Zwecke, die man mit der Äußerung eines gegebenen Satzes verfolgt, Gegenstand der Grammatik sein sollten, sehe ich nicht.

Andererseits trifft es nicht zu, daß, wie in (20) behauptet, eine 'paradigmatische Korrektur' mit einer Deakzentuierung der Konstituenten ohne 'Primärakzent' einhergeht. Es ist empirisch nicht der Fall, daß z. B. (9a) je nach Verwendungszusammenhang phonetisch anders realisiert würde, etwa derart, daß bei 'paradigmatischer Korrektur' wie mit der Fortsetzung (14) die Betonungsverhältnisse obligatorisch anders wären als bei Fortsetzungen wie (22), die keine 'paradigmatischen Korrekturen' sind:<sup>5</sup>

	- b. … und *nicht*, wie du behauptest, seinen Geburtstag igno*rier*en

Es trifft wohl zu, daß man sprachliche Unterschiede besonders hervorheben kann; so kann man Betonungsunterschiede dadurch hervorheben, daß man voll betonte Konstituenten besonders stark betont und gering betonte Konstituenten intonatorisch und akzentuell besonders wenig hervorhebt. In ähnlicher Weise kann man den Unterschied zwischen *Pein* und *Bein* dadurch hervorheben, daß man das /p/ in *Pein* besonders stark aspiriert, während man bei dem /b/ in *Bein* die Öffnung des Verschlusses relativ zum Beginn der Stimmlippenschwingung besonders lange hinauszögert. Dies sind jedoch ganz allgemeine performatorische Strategien zur Verdeutlichung sprachlicher Kontraste, die als solche niemals obligatorisch sind. Da die Deakzentuierung von (20) daher nicht obligatorisch und kein Phänomen von systematischem Interesse ist, sollte sie außer Betracht bleiben. Die unter (19) genannten Betonungseigenschaften sind von den unter (15) genannten nicht zu unterscheiden. Daraus folgt, daß es keinen theoretisch interessanten Unterschied zwischen 'normaler', 'kontrastiver' und 'emphatischer' Betonung (bei Bierwisch) gibt.<sup>6</sup>

<sup>5</sup>Die in (20) angesprochene Deakzentuierung hat Bierwisch ja offensichtlich auch nicht empirisch beobachtet; er hält lediglich die " Annahme", daß es so etwas gibt, für " plausibel". 6

Eine solche Kritik ist natürlich in gewissem Maße ungerecht, da es Bierwisch weniger darum geht, optimale Definitionen für nicht-normale vs. normale Betonungen aufzustellen, als darum, für intuitiv 'normale' Betonungen Regeln aufzustellen. Entsprechendes gilt für die unter (8), (23), (28), (29) zitierten Äußerungen von Altmann.

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

Als letzten Explikationsversuch, diesmal für 'kontrastive' (im Unterschied zu 'normalbetonten') Äußerungen, betrachten wir (23):

(23) Unter kontrastiven Äußerungen sind "Äußerungen zu verstehen, die nicht als Antwort auf eine Wortfrage (im Sinne des Fragesatztestes) folgen können, sondern dem Typ der Gegenbehauptung zu einer expliziten deklarativen Äußerung (aber auch zu einer sicheren Annahme) entsprechen."

(Altmann 1977: 100)

In diesem Zitat geht Altmann offenbar davon aus, daß man nur dann sinnvoll davon sprechen kann, ein Satz S*<sup>i</sup>* weise 'Kontrastbetonung' auf, wenn mit der Äußerung von S*<sup>i</sup>* eine Kontrastierungshandlung vollzogen wird. Es ist aber klar, daß unter dieser Annahme keine Explikation des traditionellen Sprachgebrauches möglich ist; (24a) z. B. weist nach üblicher Ausdrucksweise entschieden 'Kontrastbetonung' auf, muß aber keineswegs als Gegenbehauptung (etwa zu (24b)) verwendet werden, sondern kann auch (im Sinne

	- b. ich glaube, *Heinz* hat den Hund geschlagen
	- c. wer hat den Hund geschlagen?

des 'Fragesatztests') als Antwort auf (24c) dienen. Umgekehrt kann ein Satz mit 'Normalbetonung' wie (25a) auch als Gegenbehauptung

	- b. ich glaube, Karl hat die *Katze* geschlagen

(etwa zu (25b)) verwendet werden. Die Frage, zu welchem Zweck eine Äußerung getan wird, trägt zur Explikation der tradierten Begriffe ersichtlich nichts bei.

Die Formulierung in (23) impliziert offenbar, daß alle Äußerungstypen, die nicht als Antworten auf Wortfragen im Sinne des 'Fragesatztests' dienen können, 'kontrastiv', d. h. jedenfalls 'nicht-normal' sind. Auch in dieser Hinsicht ist (23) keine Explikation der traditionellen Begriffe. So sind die Erstglieder von sog. exozentrischen Determinativkomposita im Allgemeinen nicht erfragbar; die a-Sätze in (26) und (27) sind keine Antworten auf die b-Sätze:

	- b. welches Maul hast du gesehen?
	- b. was für einen Finger hast du erwischt?

Gleichwohl sind (26a), (27a) zweifellos normal betont. Auch Sätze mit dem Adverb *übrigens* können nicht als Antworten auf Fragen verwendet werden; trotzdem wird niemand sagen wollen, sie seien generell 'nicht-normal' betont.<sup>7</sup>

Nach all diesen vergeblichen Explikationsversuchen drängt sich der Verdacht auf, daß es da in Wahrheit gar nichts zu explizieren gibt; daß die Rede von 'Normalbetonung' usw. eventuell nur eine von vielen terminologischen Traditionen in der Grammatik ohne substantiellen Gehalt ist. Eben diesen Schluß zieht Altmann:

(28) " Einerseits konnte gezeigt werden, daß die Annahme eines Normalakzents für jeden satzwertigen Ausdruck […] sich zwar auf tiefwurzelnde Intuitionen stützen kann (die sogar testbar und statistisch erfaßbar sind), daß sie aber theoretisch nicht haltbar ist: [eine gewisse Betonung B1] ist nicht weniger normal bezüglich eines bestimmten Gebrauchs als [eine andere Betonung B2]." (Altmann 1978: 109)

(wobei wohl zu ergänzen wäre: … bezüglich eines anderen Gebrauchs). Dementsprechend spricht er einerseits von

(29) " Akzentpositionen […], die von kompetenten Sprechern des Deutschen automatisch als die " normalen Akzentpositionen" bezeichnet werden"

(Altmann 1978: 97)

und betont andererseits, " daß es keinen " normalen" Satzakzent für ein bestimmtes Satzexemplar gibt" (Altmann 1978: 95).

Diese Aussagen sind offensichtlich widersprüchlich. Wenn die Sprecher wirklich so tiefwurzelnde und automatisch wirksame Intuitionen für 'Normalbetonung' haben, wie es in (28) und (29) behauptet wird, dann ist eine Theorie, die es


<sup>7</sup>Auch zu Satzfragen, bei denen man gewöhnlich durchaus zwischen 'normaler' und 'nichtnormaler' Betonung unterscheidet – vgl. (i) vs. (ii) – gibt es keine entsprechenden Wortfragen.

Aus Gründen wie diesen ist nicht möglich, die Eruierung des Satzfokus quasi-operational vom Ergebnis des 'Fragesatztests' abhängig zu machen. Der 'Test' des natürlichen Widerspruchs, wie ihn Chomsky (1976b) verwendet, liefert teilweise bessere Ergebnisse als der 'Fragesatztest', ist aber auch nicht auf alle relevanten Beispiele anzuwenden. In jedem Fall gilt, daß derartige 'Tests' u. U. heuristisch nützlich sind, aber nicht zur Definition theoretischer Begriffe dienen können: Ein 'Test' ist nur dann aussagekräftig, wenn klar ist, inwiefern und warum er zur Abgrenzung der fraglichen Begriffe beiträgt. Dies aber setzt eine unabhängige Klärung dieser Begriffe voraus. (Umgekehrt ist zu erwarten, daß mit Hilfe einer adäquaten Fokustheorie Relationen wie " natürliche Antwort", " natürlicher Widerspruch", " natürliche Fortsetzung" explizierbar werden; vgl. z. B. Chomsky (1976b: 100); Stechow (1980a)).

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

nicht erlaubt, diesen Intuitionen Rechnung zu tragen, selbst nicht haltbar. (Wir kommen auf (28) in 1.4.1 noch einmal zurück.)

Wenn es auch etwas übertrieben ist, von allgemein und automatisch mit eindeutigen Aussagen reagierenden Intuitionen zu reden, glaube ich doch, daß Altmann soweit Recht hat, daß sehr viele Sprecher bei sehr vielen Beispielen ein klares Gefühl haben, daß eine gegebene Betonung unauffällig, 'normal' ist, während eine andere Betonung auffällig, 'nicht-normal' ist. Um hervorzuheben, daß es demzufolge ein reales Explikandum gibt und daß dies mit primären Sprecherintuitionen zu tun hat, formuliere ich das als eigenen Explikationsversuch:

(30) Ein Satz ist normal betont, wenn die Sprecher diese Betonung als stilistisch normal empfinden; er ist nicht-normal betont, wenn sie diese Betonung als stilistisch nicht-normal empfinden.

Damit ist klar, daß 'stilistisch normale Betonung' ein relevanter Begriff ist, da er – als unmittelbares und offenbar systematisches Urteil der Sprecherintuition – etwa den gleichen Rang wie Urteile über Akzeptabilität oder Synonymie einnimmt; es ist auch klar, daß er als intuitives Urteil – genau so wie der Begriff der Akzeptabilität oder der der Synonymie – nicht definitorisch auf andere Begriffe zurückgeführt werden kann; in diesem Sinne ist er ein essentieller Begriff. Für sprachwissenschaftliche Zwecke ist mit dieser Bestimmung natürlich so lange noch wenig gewonnen, wie es unklar ist, welche Eigenschaften der Sätze ein solches Stilempfinden beeinflussen. Dies versuche ich im folgenden Abschnitt mit Hilfe des Begriffs 'Fokus' zu klären.

Erst wenn wir eine inhaltlich gefüllte signifikante Explikation von 'Normalbetonung' haben, können wir beurteilen, in welchem Maße und in welchem Sinne die Unterscheidung zwischen normaler und nicht-normaler Betonung z. B. für die Syntax eventuell belangvoll ist.

### **1.3 Fokus, Kontext und Betonung**

### **1.3.1 Bestimmung von 'Fokus'**

Ich gebrauche den Ausdruck 'Fokus' in derselben Weise wie Chomsky (1976b). Nach dieser terminologischen Tradition gilt folgendes für die Sätze in (31): Der Fokus von (31a) ist *Karl*; das notiere ich so: Fk (31a) = *Karl*. Für die anderen Sätze gilt: Fk (31b) = *dem Kind*; Fk (31c) = *das Buch*; Fk (31d) = *geschenkt*.

	- b. Karl hat dem *Kind* das Buch geschenkt
	- c. Karl hat dem Kind das *Buch* geschenkt
	- d. Karl hat dem Kind das Buch *geschenkt*

Grob gesprochen ist der Fokus der Teil des Satzes, mit dem in gewissem Sinne etwas Neues mitgeteilt wird; der Rest des Satzes – das 'Topik' – wird als bekannt vorausgesetzt.<sup>8</sup> Eine genauere Formulierung ist in (32) gegeben:

(32) *Inhaltliche Bestimmung von 'Fokus':*

Bei einer Äußerung eines Satzes S*<sup>i</sup>* ist jener Teil von S*<sup>i</sup>* der Fokus Fk (S*<sup>i</sup>* ), dessen Funktion in S*<sup>i</sup>* nicht aufgrund des relevanten Kontexts bekannt ist. (Die übrigen Teile von S*<sup>i</sup>* bilden das Topik Tk (S*<sup>i</sup>* ).)

Dazu einige Erläuterungen.

'Relevanter Kontext' (RK) ist das, was man als das gemeinsame Vorwissen von Sprecher und Hörer bezeichnen kann und was Chomsky (1976b) – in einer ungewöhnlichen Verwendung des Worts – 'Presupposition' nennt. Bei einer Äußerung von (31a) geht der Sprecher offensichtlich davon aus, daß es ihm und dem Hörer bekannt ist, daß jemand dem Kind das Buch geschenkt hat, und daß es dem Hörer unbekannt ist, daß (er, der Sprecher, glaubt, daß) die Agensrolle von Karl ausgefüllt worden ist; insofern ist die Funktion von *Karl* in (31a) das, was für den Hörer 'neu' ist. Entsprechend bei den anderen Beispielen; insbesondere nimmt der Sprecher bei einer Äußerung von (31d) an, daß aus dem RK bekannt ist, daß es einen Vorgang gegeben hat, an dem Karl, das Kind und das Buch in je bestimmter Weise beteiligt waren; daß die Funktion, diesen Vorgang zu bezeichnen, von *geschenkt* und nicht z. B. von *gestohlen* übernommen wird, ist (nach der Annahme des Sprechers) nicht aus dem RK bekannt.<sup>9</sup>

<sup>8</sup> Für einen von Topik und Fokus verschiedenen Teil 'Transition', wie er u. a. z. B. in Sgall et al. (1973) angenommen wird, ist in der hier zu entwickelnden Explikation kein Raum. Ebenfalls ungerechtfertigt scheint es mir, neben der Unterscheidung von Fokus und Topik ähnliche, aber nicht identische Unterscheidungen wie 'Thema/Rhema' und 'psychologisches Subjekt/Objekt' einzuführen (die alle mit 'dominance' im Sinne von Erteschik-Shir nichts zu tun haben). Vgl. zur Kritik Pasch (1978a,b), Sgall & Hajicǒvá (1977).

<sup>9</sup>Häufig (z. B. in Erteschik-Shir & Lappin 1979 [1980]: 43) wird angenommen, daß bei Chomsky, anders als in (32), 'Fokus' als " phrase containing the intonation center" definiert sei. Dieser Eindruck beruht jedoch auf ungenauer Lektüre. In Chomsky (1976b: 89) werden zunächst die Ausdrücke " focus" und " presupposition" eingeführt und mittels 'natürlicher Erwiderungen' charakterisiert; erst danach heißt es S. 90 " … one might propose that the focus is determined by the surface structure, namely, as the phrase containing the intonation center". 'Fokus' ist also in Chomsky (1976b) ebenso wie in (32) begrifflich unabhängig von Betonungsfaktoren: Er ist aufgrund des 'intonation center' determiniert, nicht aber definiert. Es liegt auf der Hand, daß nur auf diese Weise ein inhaltlich nicht-trivialer Begriff von Fokus zu etablieren ist.

Erteschik-Shir benutzt den Begriff 'dominant constituent', der mit 'Fokus' eng verwandt, aber, wie sie (Erteschik-Shir 1979: 443ff; Erteschik-Shir & Lappin 1979 [1980]: 43ff) betont, nicht identisch ist. Der wesentliche Unterschied scheint zu sein, daß ein nach (32) bestimmter Fokus einen Teil enthalten kann, der dem Sprecher/Hörer 'wichtiger' erscheint als der Rest des Fokus. Eine solche Unterscheidung ist intuitiv nicht unplausibel, und Erteschik-Shir versucht anhand interessanten Materials, ihre theoretische Relevanz nachzuweisen. Wenn ich recht sehe, bedeutet das (wenn sie Recht hat), daß für gewisse Zwecke neben der Fokus/Topik-Unterscheidung

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

In (32) ist 'Fokus' für Äußerungen von Sätzen bestimmt worden. Da wir künftig meistens – wie schon bei (31) – nicht Äußerungen, sondern Sätze betrachten, benötigen wir den Begriff 'möglicher Fokus':

(33) Ein Satz S*<sup>i</sup>* hat den *möglichen Fokus* Fk*<sup>j</sup>* (S*i* ), wenn Fk*<sup>j</sup>* (S*i* ) bei einer Äußerung von S*<sup>i</sup>* Fokus sein kann.

Mögliche Foki notiere ich, wie in (33), künftig mit einem Index an " Fk". Wo kein Mißverständnis nahe liegt, spreche ich oft einfach von 'Fokus' statt von 'möglichem Fokus'; ebenso unterdrücke ich gelegentlich die Angabe " (S*i* )".

Für formale Zwecke kann man den RK als eine Menge von Sätzen und/oder Propositionen repräsentieren. Wir können dann RK weitgehend mit dem identifizieren, was Kempson 'Pragmatic Universe of Discourse' nennt:

	- (1) S believes P*<sup>i</sup>*
	- (2) S believes H knows P*<sup>i</sup>*
	- (3) S believes H knows S believes P*<sup>i</sup>*
	- (4) S believes H knows S believes H knows P*<sup>i</sup>*

I shall call this set of propositions the Pragmatic Universe of Discourse." (Kempson 1975: 167)

Allerdings muß die Repräsentation von RK auch natursprachliche Sätze enthalten können (Propositionen formuliert man gewöhnlich in einer formalen Sprache), da Sprecher und Hörer u. U. wissen, daß und wie ein bestimmter Satz geäußert worden ist (und sich nicht nur an seinen Inhalt erinnern); außerdem können in RK Sätze vorkommen, die außer natursprachlichen auch formale Elemente enthalten. So kann es sein, daß der Sprecher etwas gesagt hat, das der Hörer wie (35) gespeichert hat, wobei " *W*" eine Variable für phonetisches Material ist; (35) repräsentiert dann das, was Sprecher und Hörer über die fragliche Äußerung wissen. Solche Fälle führen dann oft zu Rückfragen etwa wie (36):

	- b. Karl ist etwas wichtiges *W* gefallen
	- b. hast du gesagt " *ein*gefallen" oder " *auf*gefallen"?

weitere semantisch/pragmatische Unterscheidungen eingeführt werden müssen. Manche Einzelheiten der begrifflichen Bestimmung von 'dominance' und ihrer empirischen Verwendung scheinen mir jedoch sehr klärungsbedürftig. Überflüssig wird der Fokusbegriff, wie es scheint, dadurch jedenfalls nicht.

Wenn wir eine solche Repräsentation von RK voraussetzen, können wir 'Fokus' auch, formal bestimmen:<sup>10</sup>

	- Bei einer Äußerung von S*<sup>i</sup>* ist jener Teil von S*<sup>i</sup>* der Fk (S*<sup>i</sup>* ), der entweder
	- a. einer *W*-Variablen in einem Satz S<sup>W</sup> *i* in RK oder
	- b. einem Satzoperator oder einem Konjunkt in der normalisierten logischen Charakterisierung von S*<sup>i</sup>*

entspricht, das nicht in RK enthalten ist.

Dabei ist " S W *<sup>i</sup>* " ein Satz, der mit S*<sup>i</sup>* identisch ist bis auf die Tatsache, daß er eine oder mehrere *W*-Variablen enthält, wo S*<sup>i</sup>* phonetisches Material hat. Was ich unter einer 'normalisierten logischen Charakterisierung' verstehe, möchte ich an einem Beispiel verdeutlichen. Nehmen wir an, daß die auf reguläre Weise gewonnene logische Charakterisierung der Sätze in (31) (unter Absehung von Tempus usw.) die Form (38a) hat. Dann hat die 'normalisierte logische Charakterisierung' die Form (38b):

	- b. ∃r ∃x ∃y ∃z (r (x, y, z)
		- & r (x, y, z) = SCHENK (x, y, z) & x = KARL & y = KIND & z = BUCH)

<sup>10</sup>Eine inhaltlich mit (37) weitgehend übereinstimmende Bestimmung gibt Kempson (1975: 192f) anlässlich eines Falles von 'Kontrastbetonung'. Eng verwandt ist auch die durch einige sorgfältige Fallanalysen gestützte Explikation von Pasch (1978b).

Die Definition (37b) macht explizit, daß es bei der Bestimmung des (semantischen) Fokus von S*i* um das Verhältnis zwischen RK und der logischen Charakterisierung von S*i* geht. Im Ergebnis erhalten wir ein Paar (S*i* , Fk (S*i* )), das die logischen Eigenschaften von S*i* zusammen mit den kontextuellen Verwendungsmöglichkeiten von S*i* bestimmt.

Denselben Grundgedanken hat Stechow (Stechow 1980a,b) in völlig anderer Weise verwendet: An Stelle des Paars (S*i* , Fk (S*i* )) gebraucht er den Begriff 'Fokusinformation' und definiert ihn als die materiale Implikation zwischen der 'Topikinformation' und dem 'Inhalt' von S*i* ; mit unwesentlicher Vergröberung können wir dafür die (materiale) Implikation 'RK *⊃* S*<sup>i</sup>* ' einsetzen. Diese Deutung der 'Funktion' des Fokus ist nicht nur intuitiv überraschend, sondern führt auch zu unüberwindlichen Schwierigkeiten, besonders bei Sätzen wie (43b) in unserem Text sowie (i), (iii) und (iv) von Fn.15. (Deren RK ist trivial wahr, ihre 'Fokusinformation' wäre deshalb äquivalent mit S*i* – ein offensichtlich unerwünschtes Ergebnis. Die in Stechow (1980b) erörterten Lösungsvorschläge halte ich für unzureichend.) Soweit ich sehe, wird alles, was Stechows Fokustheorie leisten soll, auf einleuchtendere und einfachere Weise von unserer Theorie geleistet, ohne daß Probleme der angedeuteten Art dabei auftreten können.

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

Jede *n*-stellige Proposition wird also in offensichtlicher Weise in eine Proposition mit *n + 2* Konjunkten umgeformt. Verbal kann man (38b) etwa so umschreiben: Es gibt eine Relation *r* (1. Konjunkt), die eine Relation des Schenkens (2. Konjunkt) ist; daran sind Karl (3. Konjunkt), das Kind (4. Konjunkt) und das Buch (5. Konjunkt) in je spezifischer Weise beteiligt.

Einen Fokus, der nach (37a) bestimmt ist, will ich *W*-Fokus nennen; einen, der nach (37b) bestimmt ist, nenne ich 'semantischen Fokus'. Wir nehmen an, daß alle Propositionen in RK die normalisierte Form haben. Für (31a) gilt dann, daß der Satz unter Wahrung konversationeller Maximen nur dann geäußert werden kann, wenn es (a) in RK den Satz " *W* hat dem Kind das Buch geschenkt" gibt, oder wenn (b) das erste, zweite, vierte und fünfte Konjunkt von (38b) in RK sind, nicht aber das dritte. Ähnlich kann (31d) mit semantischem Fokus nur dann geäußert werden, wenn das erste und die drei letzten Konjunkte von (38b), nicht aber das zweite, in RK sind.<sup>11</sup> (Das gilt nach unseren bisherigen Annahmen über die möglichen Foki der Sätze in (31), die wir in 1.3.2 z. T. korrigieren werden.)

Daß ein Satz mit einem bestimmten Fokus nur geäußert werden kann, wenn der relevante Kontext bestimmte Eigenschaften hat, heißt: Nur in einem solchen Kontexttyp kann der Satz unter Wahrung konversationeller Maximen (vgl. Grice 1975) geäußert werden. Es heißt natürlich nicht, daß Äußerungen, die die Bestimmungen von (32) und (37) verletzen, nicht vorkommen könnten; tatsächlich sind Verletzungen dieser Bedingungen in alltäglicher Kommunikation nicht selten. Sie lösen jedoch Kommunikationsprobleme aus: Der Hörer muß entweder auf relativ zuverlässige konversationelle Implikaturen zurückgreifen, oder er ist auf sehr unsichere Spekulationen über die Intentionen des Sprechers angewiesen; u. U. bricht die Verständigung zusammen. Für weitere Diskussion vgl. 1.4.4. 12

<sup>11</sup>Das in den Grundzügen wohl ähnlich gemeinte Repräsentationssystem in Bartsch (1976: 542f) enthält keine Möglichkeit, die Zugehörigkeit des Verbs zum Fokus formal zu kennzeichnen.

<sup>12</sup>Siehe auch Clark & Haviland (1977), wo anhand verschiedener sprachlicher Phänomene die Fruchtbarkeit des Fokusbegriffs von (32) und (37) in Verbindung mit der Annahme konversationeller Maximen demonstriert wird.

In diesem Zusammenhang finden auch Strategien der Wiederholung eine Erklärung; einige Typen werden in Lehman (1977) besprochen.

Die Theorie der konversationellen Maximen zieht ihre Attraktivität und explanatorische Potenz wesentlich aus der Tatsache, daß sie eine allgemeine (nicht spezifisch sprachliche und nicht kulturspezifische) Theorie kooperativen Verhaltens ist. Keenan (1977) versucht diese Theorie zu erschüttern, indem sie auf systematische Verletzungen der konversationellen Maximen in der Kultur von Madagaskar hinweist. Tatsächlich bestätigen ihre Beobachtungen jedoch die Theorie: Die Maximen werden dort – wie überall sonst – gerade dann verletzt, wenn unkooperatives Verhalten zum Prinzip gemacht wird; wo dies nicht der Fall ist (nach Keenan besonders innerhalb der Familie und der nächsten Verwandtschaft), werden die Maximen beachtet.

Natürlich ist eine 'logische Charakterisierung' wie (38a) und damit auch ihre normalisierte Form (38b) nur in sehr einfachen Fällen zureichend. Wir wollen anhand von (39) überlegen, welche in (38a,b) nicht berücksichtigten Faktoren in einer expliziteren Darstellung noch berücksichtigt werden müßten.

### (39) Karl *ist* krank

Man kann *ist* in (39) als *W*-Fokus interpretieren, etwa als Antwort auf (40a), wobei in RK (40b) enthalten ist. Es kann aber auch ein semantischer Fokus vorliegen, der etwa im Gegensatz zu (41a) steht, wobei in RK ist,

	- b. Karl *W* krank
	- b. Karl *war* krank

daß eine Relation zwischen Karl und Kranksein besteht. Ebenso kann ein impliziter Gegensatz zu (41b) vorliegen; in diesem Fall ist in RK, daß Karl zu einem bestimmten Zeitpunkt *t* krank (gewesen) ist, und die in der Flexionsform von *sei*enthaltene Bestimmung von *t* ist das, was nicht in RK ist. Um dies darzustellen, müssen wir in der normalisierten logischen Charakterisierung eine Variable für *t* ansetzen.

Auf eine vierte Verwendungsweise für (39), die weniger leicht zu analysieren ist, hat Fuchs (1976: 309f) aufmerksam gemacht: wenn der Satz nämlich als nachdrückliche Affirmation, etwa auf die Frage (42), gebraucht wird. Essentiell das gleiche scheint

	- b. doch, Karl *hat* den Hund getreten

in (43b) als Entgegnung auf (43a) vorzuliegen; es scheint nicht möglich, *hat* in (43b) als *W*-Fokus oder als semantischen Fokus wie in (41a,b) zu verstehen; jedenfalls nicht im Kontext (43a). Besonders interessant ist dieses Phänomen mit Negation (44a) und Fragen (44b,c). (Dabei kommt als komplizierendes Moment hinzu,

	- b. *hat* Karl den Hund denn getreten?
	- c. wer *hat* den Hund denn eigentlich getreten?

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

daß Frageelemente (bei Satz- wie bei Wortfragen),<sup>13</sup> Adverbiale wie *eigentlich*, *vermutlich* und 'Gradpartikeln' wie *sogar*, *nur*, *auch* generell und die Negation häufig zum Fokus gehören; zu Negation und Gradpartikeln vgl. die – trotz aller Mängel, cf. Hust & Brame (1976: 266-73) – relevante Diskussion in Jackendoff (1972: Kapitel 6 und 8.6); zu Satzadverbialen vgl. Verhagen (1979).) Im Fokus steht hier offenbar immer die Wahrheitsbehauptung, wie ich es in den Umschreibungen in (45) anzudeuten versuche:

	- b. doch, es ist wahr, daß Karl den Hund getreten hat (zu (43b))
	- c. aber wahr ist doch, daß Karl den Hund gar nicht getreten hat (zu (44a))
	- d. ist es denn wahr, daß Karl den Hund getreten hat? (zu (44b))
	- e. für welche Person x gilt, daß es wahr ist, daß x den Hund getreten hat? (zu (44c))


(Dabei ist *wen* in (ii.b) durch " ?" und die freie Variable *z* repräsentiert.)

Die Verwendungsbedingungen scheinen so zu sein, daß für (i.a) ein Kontext wie (iii.a) gegeben sein muß, also (iii.b) in RK ist; für (ii.a) ein Kontext wie (iv.a), also (iv.b) in RK:

	- b. T (∃r ∃x ∃y (r (x, y) & x = KARL))

Nach (37) ist dann in (i.a) *Karl* Teil des Fokus, und da der Operator " ?" von (i.b) nicht in RK (d. h. nicht in (iii.b)) enthalten ist, ist auch der Teil des Satzes, dem der Operator " ?" zugeordnet ist, dem Fokus zuzurechnen. Entsprechend ist bei (ii.a) nach (37) *schlägt* Teil des Fokus, und da weder der Operator " ?" noch die freie Variable *z* von (ii.b) in (iv.b) enthalten ist, ist die ihnen zugeordnete Konstituente *wen* ebenfalls Teil des Fokus.

<sup>13</sup>Mit " Frageelement" meine ich ein abstraktes Element, das den Satz als Frage kennzeichnet; bei Ergänzungsfragen ist es Teil des Interrogativpronomens. Daß solche Frageelemente generell zum Fokus gehören, folgt aus (37), wenn wir folgende Annahmen machen:

Aussagesätze werden durch einen Operator für die Wahrheitsbehauptung *T* (entsprechend Freges Urteilsstrich) gekennzeichnet; direkte Fragesätze erhalten statt dessen einen Operator " ?". Satz (i.a) wäre dann etwa als (i.b) zu repräsentieren, Satz (ii.a) als (ii.b):

Um dies in der normalisierten logischen Charakterisierung zu erfassen, muß das finite Verb in diesen Konstruktionen einem Operator für die Wahrheitsbehauptung *<sup>T</sup>* bzw. einem Frageoperator " ?" (vgl. Fn.13) zugeordnet werden.<sup>14</sup>

Daß diese Analyse intuitiv richtig ist, zeigt sich deutlich an einem Beispiel von Fuchs:

" (Fritz hat seine Mutter gebeten, zum Mittagessen Ravioli zu kochen, sie hat es halb versprochen. Kurz darauf kommt er in die Küche, sieht die Mutter am Herd und fragt:) Gelt du *kochst* Ravioli?" (Fuchs 1976: 309 (25))

Aufgrund des gegebenen Kontexts kann nicht die Frage sein, was die Mutter tut oder was sie mit Ravioli tut. In RK ist, daß es möglich ist, daß die Mutter Ravioli kocht; gefragt ist im Beispiel, ob es wahr ist, daß sie das tut. Durch die Betonung des Finitums ist hier wieder die Wahrheitsbehauptung als das nicht in RK enthaltene Element bestimmt.

(39i) T (∃r ∃x (r (x) & r (x) = KRANK (x) & x = KARL))

	- b. ist Karl *krank*?
	- c. Heinz behauptet, daß Karl *krank* ist

Wenn das finite Verb in Konstruktionen dieser Art (nicht-eingebettete Sätze mit Anfangsstellung des finiten Verbs) dem Operator *<sup>T</sup>* (bzw. " ?") zugeordnet ist, folgt aus (37), daß es zum Fokus gehört (da dieser Operator nicht in (39iii) enthalten ist).

In Fällen wie (39), (43b), (44) bildet die betonte Konstituente (das finite Verb) also eigentlich nicht als ganze den Fokus, sondern nur ein Teil von ihr (das mit der finiten Form verbundene flexivische Element). Das entspricht nicht ganz der Hypothese (66), ist aber insofern leicht zu verstehen, als dieser relevante Teil aus phonologischen Gründen gegenüber anderen Teilen derselben Konstituente intonatorisch im Allgemeinen nicht hervorgehoben werden kann.

Anders ist es bei gewissen Typen von Exklamativen. Hans Altmann hat mich auf Sätze wie (i) aufmerksam gemacht, die man wie (ii)


(aber kaum wie (iii)) gebrauchen kann. Hier scheint das betonte *der* entweder gar nicht zum Fokus zu gehören oder jedenfalls keinen minimalen Fokus bilden zu können. Dies ist ein offenes Beschreibungsproblem, und mehr noch ein Erklärungsproblem.

<sup>14</sup>Satz (39) hat die logische Repräsentation (39i) und benötigt in der relevanten Interpretation einen Kontext wie (39ii.a, b oder c); der relevante Teil des RK ist also wie (39iii) zu repräsentieren:

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

Bestandteil des 'Vorwissens', das Sprecher und Hörer gemeinsam ist, ist in solchen Fällen also nur der 'propositionale Gehalt' des Satzes, also das, was Frege in seinen frühen Schriften 'beurteilbaren Inhalt' (Frege 1879: 2–5) und später 'Gedanken' (z. B. Frege 1892: 32) genannt hat; ohne die 'Anerkennung der Wahrheit' des Gedankens (die das 'Urteil' ausmacht; cf. z. B. Frege (1879: 1f.; 1892: 35)).

Die P*<sup>i</sup>* im Zitat (34) von Kempson sind daher im Allgemeinen – vermutlich gegen Kempsons Absicht – als Propositionen mit unbekanntem Wahrheitswert anzusehen. Daß nur der propositionale Gehalt eines Satzes in RK ist, ist dabei nicht etwa eine pathologische Eigenschaft von Spezialfällen wie (39), (43b) usw. Auch z. B. in (46b) als Erwiderung auf (46a) ist der *ob*-Satz offensichtlich in RK, d. h. Topik von (46b),

	- b. B: es ist mir ziemlich egal, ob sie ihn liebt
	- c. A: Karl behauptet, daß Hans eine geniale Entdeckung gemacht hat
	- d. B: daß Hans eine geniale Entdeckung gemacht hat, kann ich mir beim besten Willen nicht vorstellen

ohne daß sein Wahrheitswert aus RK bekannt wäre; ebenso bei dem *daß*-Satz von (46d) als Antwort auf (46c). Entgegen weit verbreiteter (z. B. auch in Clark & Haviland (1977) vertretener) Ansicht kann man also RK keinesfalls mit der Menge von Propositionen identifizieren, die Sprecher und Hörer als wahr akzeptieren.<sup>15</sup>

Wir haben eine inhaltliche und eine formale Bestimmung für 'Fokus' gegeben. Wie kann man – in Fällen, die intuitiv nicht völlig klar sind – den Fokus praktisch bestimmen? Automatische Entdeckungs- oder Entscheidungsprozeduren gibt es da nicht. Grundsätzlich muß man einen Kontext konstruieren oder aufsuchen, der soweit spezifiziert ist, daß man mit einiger intuitiven Sicherheit sagen kann, ob der fragliche Satz in diesem Kontext den hypothetisch angenommenen Fokus

<sup>15</sup>Dies ist mehrfach (z. B. in Jackendoff (1972: 246), Rochemont (1978: 98)) für Fälle wie (i) beobachtet worden. Hier ist *niemand* = Fk (i), und in RK ist ein Äquivalent von (ii),

<sup>(</sup>i) *niemand* hat gelacht

<sup>(</sup>ii) jemand hat gelacht

aber offensichtlich wird (ii) von einem Sprecher von (i) nicht als wahr akzeptiert. Entsprechendes gilt für Beispiele wie (iii) und (iv):

<sup>(</sup>iii) *vielleicht* hat Karl gelacht

<sup>(</sup>iv) Karl hat *nicht* gelacht

haben kann. In vielen Fällen reicht es aus, eine 'natürliche' Erwiderung zu konstruieren, deren Form es klar macht, welche Teile der Sätze einander gegenüber gestellt werden (und damit den Fokus bilden). Zu betonen ist, daß der in (23) angesprochene 'Fragesatztest' kein 'Test' ist. Wenn die Frage (47a) als Nachweis dafür dienen soll, daß *den Jungen* ein Fk*<sup>i</sup>* (47b), aber nicht ein Fk*<sup>i</sup>* (47c) ist,

	- b. der Mann hat den *Jungen* gestreichelt
	- c. der *Mann* hat den Jungen gestreichelt
	- d. er hat den *Jungen* gestreichelt
	- e. den *Jungen*

müßte (47b) zumindest als 'natürliche' Antwort auf (47a) gelten können. Das ist im Allgemeinen jedoch nicht der Fall; typischerweise wird in 'natürlichen' Antworten pronominalisiert (47d) oder überhaupt nur die erfragte Konstituente angegeben (47e), so daß (47a) als 'Test' für (47b) entfällt. Vgl. auch Fn. 7.

Trotzdem können solche Fragen in einfachen Fällen die ihnen zugedachte Aufgabe erfüllen; nicht als 'Test' für einen vorgegebenen Satz, sondern dadurch, daß der verständige Leser aus der Frage entnimmt, was Teil des RK sein soll und was als 'neue Information' gelten kann.

### **1.3.2 Verschiedene Fokusmöglichkeiten**

Kehren wir noch einmal zu den Beispielen in (31) zurück; ich wiederhole sie hier einzeln mit neuer Numerierung. Wenn wir (48) (= (31c)) näher betrachten, zeigt sich, daß der Satz nicht nur in Kontexten geäußert werden kann, in denen, wie die Frage (49a) andeutet, allein *das Buch* Fokus ist. Vielmehr hat (48) alle in (50) angegebenen möglichen Foki, entsprechend den Fragen (49a–e);<sup>16</sup> hingegen

	- b. was hat Karl hinsichtlich des Kindes getan?
	- c. was hat Karl getan?

<sup>16</sup>Griesbach behauptet, daß bei minimalem Fokus wie in (50a) – im Gegensatz zu einem maximalen Fokus wie (50e) – das Akkusativobjekt " beim Sprechen […] hervorgehoben" werde. Dafür sehe ich keine empirische Grundlage. Möglicherweise gibt es spezielle Intonationsmittel, um in solchen Fällen den minimalen Fokus als solchen auszuzeichnen. Sie sind jedoch keinesfalls obligatorisch, und es gilt durchaus nicht nur für die " geschrieben[e] Aussage", daß " nur der Zusammenhang Aufschluß geben [kann], wie dieser Satz gemeint ist" (Griesbach 1961 (IV): 85).

3 Explikationen für "normale Betonung" und "normale Wortstellung"


### (50) a. Fk<sup>1</sup> (48) = das Buch


paßt (48) nicht in die durch (49f–k) angedeuteten Kontexte. (Insbesondere paßt (48) nicht, wie Bartsch (1976: 523) behauptet, zu (49k)).

Dabei ist der vierte Fokus (50d) besonders wichtig, weil er zeigt, daß ein Fokus nicht immer eine Konstituente des Satzes ist, wie z. B. in Chomsky (1976b) angenommen: Während die übrigen Foki in einigen Theorien über Konstituentenstrukturen deutscher Sätze als Konstituenten analysiert werden können, ist dies bei (50d) ausgeschlossen.<sup>17</sup> Um sicherzustellen, daß dies wirklich ein möglicher Fokus von (48) ist, sei noch eine Kontrastierung wie (51b) vs. (51c) angegeben, wo die nicht-identischen Teile der Sätze offensichtlich nicht aus RK bekannt sind:

	- b. hat Karl dem Kind (schon) das *Buch* geschenkt?
	- c. oder hat das Kind heute *schulfrei*?

Im Fall von (50e) haben wir als Fokus die Menge aller Konstituenten von (48), notiert als " MK (48)".

Wenn wir (52) (= (31a)) betrachten, finden wir, daß unter allen in (49) angedeuteten Kontexten einzig (49f) passend ist, so daß Fk<sup>1</sup> (52) = *Karl* der einzig mögliche Fokus ist. Ähnlich bei (53) (= (31b)); unter allen Fragen in (49) paßt nur (49g), so daß Fk<sup>1</sup> (53) = *dem Kind* der einzig mögliche Fokus ist:

<sup>17</sup>Für Chomskys Zusammenhänge in Chomsky (1976b) ist das besonders wichtig, weil sich seine Argumentation, der Fokus müsse an der Oberflächenstruktur bestimmt werden, im wesentlichen auf die Annahme stützt, daß der Fokus eine Konstituente ist.


Bei (54) (= (31d)) haben wir (49h) als passende Frage, also Fokus wie in (55a) angegeben, aber auch (49i) ist ein passender Kontext, wie man an der Kontrastierung in (56) überprüfen kann; daher (55b):


Zum Abschluß dieser Übersicht wollen wir noch (57) betrachten; ein Beispiel, das bisher nicht vorgekommen ist. Hier passen außer (49k) auch (49c) und (49e), daher (58):

	- b. Fk<sup>2</sup> (57) = dem Kind + das Buch + geschenkt (= Fk<sup>3</sup> (48))
	- c. Fk<sup>3</sup> (57) = MK (57) = Karl + dem Kind + das Buch + geschenkt (= Fk<sup>5</sup> (48))

Es zeigt sich, daß die meisten Fragen in (49) nur zu je einem Beispiel passen, einige aber – z. B. (49c,e) – zu mehreren (nämlich zu (48) und (57)). (49j) paßt zu keinem bisher diskutierten Beispiel; wir kommen bei der Besprechung von (98) (= (4) in (4)) darauf zurück.

### **1.3.3 Explikation von** " **stilistisch normale Betonung**"

Wir haben gesehen, daß verschiedene Sätze, die außer in ihrer Betonung identisch sind, verschiedene mögliche Foki haben. Manche haben mehrere. Dabei legt zum einen rein definitorisch – cf. (32) und (37) – jeder Fokus eines Satzes fest, in welchen Kontexttypen der Satz vorkommen kann; wenn zwei Sätze S*<sup>i</sup>* , S*<sup>j</sup>* logisch identisch sind, aber S*<sup>i</sup> n* und S*<sup>j</sup> m* mögliche Foki hat, für *n > m*, dann kann S*<sup>i</sup>* in mehr verschiedenen Kontexttypen vorkommen als S*<sup>j</sup>* . Zum anderen haben wir gesehen, daß Art und Zahl der möglichen Foki eines Satzes wesentlich von seiner Betonung beeinflußt werden, und zwar in der Weise, daß die betonten Konstituenten immer Teil des Fokus sind und unbetonte dazu kommen können. Diesen durch mögliche Foki vermittelten Zusammenhang zwischen möglichen

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

Kontexttypen und Betonung will ich zur Explikation von 'Normalbetonung' nutzen.<sup>18</sup>

Dabei gehe ich von der Annahme aus, daß die Regeln der Satzgrammatik einen Satz S*<sup>i</sup>* dadurch beschreiben, daß sie ihm (mindestens) (a) eine phonologische, (b) eine morphologische, (c) eine syntaktische, (d) eine logische und (e) eine pragmatische Charakterisierung zuweisen. Für die Zwecke dieses Aufsatzes identifiziere ich die pragmatische Charakterisierung (PC) mit der Angabe der Menge der möglichen Foki von S*<sup>i</sup>* (notiert als " MF (S*<sup>i</sup>* )"). Die PC ist nicht Teil der logischen Charakterisierung (LC).

In der einschlägigen Literatur gibt es ähnliche Vorstellungen, z. B. bei Bartsch (1976) und bei Rochemont (1978); zahlreiche Autoren weichen jedoch davon ab. Viele möchten die Betonungsverhältnisse im Satz aufgrund syntaktischer und/ oder pragmatischer Regularitäten voraussagen. Wenn man dies versucht, ist nicht leicht zu sehen, wie es ohne Bezug auf den Kontext geschehen kann. Ich nehme demgegenüber an, daß die Betonung im Satz frei ist und daß die Effekte verschiedener Betonungen durch Regeln für die PC erfaßt werden. – Viele Autoren verbauen sich die Möglichkeit, die PC innerhalb der Satzgrammatik zu behandeln, indem sie nur aktuelle Foki von Äußerungen betrachten. Sobald man, wie wir es tun, die möglichen Foki von Sätzen betrachtet, entfällt dieses Problem; in dem Maße, wie eine adäquate Explikation von " Normalbetonung" und " normaler Wortstellung" speziell von der Betrachtung *möglicher* Foki abhängig ist, ist dieses Verfahren auch das einzig adäquate. – Aus ganz anderen Gründen wendet Verhagen (1979) sich dagegen, die PC innerhalb der Satzgrammatik zu behandeln. Ich halte seine Gründe nicht für stichhaltig, kann aus Raumgründen jedoch nicht darauf eingehen.

Für die unmittelbaren Zwecke dieses Aufsatzes ist es nicht entscheidend, auf der *formalen* Trennung von LC und PC – die von vielen bestritten wird – zu bestehen. Jedoch hat die Unterscheidung von Logik und Pragmatik, gerade in

<sup>18</sup>Ich beachte durchweg nur die Betonung (den Druckakzent), nicht das Intonationsmuster (den Tonhöhenverlauf). In dem hier interessierenden Phänomenbereich ist allein die Betonung topologisch relevant; verschiedene Intonationen beeinflussen die Wortstellungsmöglichkeiten im Allgemeinen nicht. Auch unterscheide ich nicht zwischen 'emphatischer', 'kontrastiver' usw. Betonung: Jeder gewählte Fokus kann für den Zweck einer 'normalen Mitteilung', einer emphatischen (z. B. empörten) Hervorhebung, einer Kontrastierung gebraucht werden. (Allerdings scheint es gewisse Intonationen zu geben, die nur für kontrastierende Verwendung geeignet sind.)

Es ist bemerkenswert, daß Contreras aus völlig unabhängigen Gründen ebenso verfährt: " … even though the intonational contours of a Mexican and those of an Argentinian may differ widely, the location of the main sentential stress, which may be signaled by different phonetic devices, seems to be conditioned by the same factors of rhematic structure" (Contreras 1976: 105).

dem hier betrachteten Teilgebiet, so fundamentale Bedeutung für die allgemeine Sprachtheorie und die Organisation der Grammatik, daß ich auf die *inhaltlichen* Unterschiede zwischen LC und PC etwas eingehen will. Dies ist umso wichtiger, als die empirischen und methodologischen Argumente für oder gegen die Trennung von LC und PC in der Literatur nicht ganz deutlich zu sein scheinen.

Aus der Definition von Fokus und Topik in (32) und (37) folgen einige wesentliche Eigenschaften dieser Unterscheidung. Das wichtigste ist: Die Unterscheidung ist an Kontextbedingungen, d. h. an 'Vorwissen' von Sprecher und Hörer geknüpft. Dies unterscheidet sie grundsätzlich von allem, was man als genuin logische Eigenschaften von Sätzen (Wahrheitsbedingungen) betrachtet. Vollkommen deutlich ist das bei den Beispielen in (31): Sie alle haben die LC (38), d. h. dieselben (durch Syntax und morphologisches Material festgelegten) Wahrheitsbedingungen; aber ihre Gebrauchsbedingungen (ihre Möglichkeiten, ohne Verletzung konversationeller Maximen geäußert zu werden) sind völlig verschieden. Es hieße, eine wesentliche Unterscheidung zu verwischen, wenn man Gebrauchsbedingungen solcher Art in gleicher Weise wie Wahrheitsbedingungen darstellen wollte.

In (37) haben wir 2 Fokustypen unterschieden: *W*-Fokus und semantischen Fokus: Es liegt auf der Hand, daß ein *W*-Fokus nicht als Teil der logischen Charakterisierung eines Satzes dargestellt werden kann, da es bei ihm wesentlich um die phonetische Form eines Satzbestandteils geht. Ansonsten liegt aber das gleiche Phänomen wie beim semantischen Fokus vor: kontextrelative Gebrauchsbedingungen und Determiniertheit durch die Betonung. Wenn ein *W*-Fokus durch eine von der LC verschiedene pragmatische Komponente charakterisiert wird, sollte auch ein semantischer Fokus von dieser Komponente charakterisiert werden.

Aufgrund der Definition von 'Fokus' sind bei verschieden betonten, aber syntaktisch und morphologisch identischen Sätzen im Allgemeinen keine logischen Unterschiede zu erwarten. Allerdings wird durch die Operation der Fokusregeln bei einem semantischen Fokus die LC in gewisser Weise modifiziert: indem eins oder mehrere ihrer Konjunkte indirekt dem Fokus zugeordnet werden und alle anderen dem Topik. Es ist daher nicht grundsätzlich ausgeschlossen, daß mit verschiedenen Foki auch verschiedene Wahrheitsbedingungen verknüpft sind. Insofern sagt die bloße Beobachtung, daß zwei morphologisch und syntaktisch gleiche Sätze je nach Betonung verschiedene logische Eigenschaften haben (oder zu haben scheinen), als solche wenig aus. Solche Unterschiede sind jedoch nur zu erwarten, wenn sie auf allgemeine Regeln zur Fokusbestimmung zurückgeführt werden können, insbesondere also wenn sie daraus folgen, daß ein Teil des Satzes aus RK bekannt ist. Es sind keinerlei Unterschiede zu erwarten, die den Unterschieden zwischen verschiedenen Morphemen entsprechen oder der

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

Unterscheidung verschiedener syntaktischer Relationen zu einem Verb; zu rechnen ist in gewissen Fällen z. B. mit Effekten, die man als Skopusunterschiede von Quantoren darstellen kann; vgl. etwa Rochemont (1978: 45). In dem Maße, wie es gelingt, vorhandene oder angebliche logische Unterschiede zwischen solchen Sätzen auf Unterschiede in den möglichen Kontexttypen zurückzuführen, finden diese logischen Unterschiede also eine *Erklärung* – was nicht der Fall wäre, wenn man sie als logische Eigenschaften wie andere in der LC darstellen würde.

Wichtig ist das u. a. bei Fällen wie (59a,b). Man kann diese Sätze verwenden, um Karl Annahmen zuzusprechen (bzw. abzusprechen), die in einem intuitiven Sinne verschieden sind; insofern mag man sie als logisch verschieden betrachten. Bei (59a) glaubt Karl

	- b. Karl glaubt nicht, daß man Heinz ent*lassen* hat

möglicherweise, daß jemand entlassen wurde, aber nicht, daß dies Heinz war; bei (59b) glaubt Karl eventuell, daß mit Heinz etwas geschehen ist, aber nicht, daß er entlassen wurde. (Über die allgemeinen Probleme bei opaken Kontexten vgl. Höhle (in Vorb.)). Diese Unterschiede folgen jedoch aus der von uns vorgesehenen pragmatischen Charakterisierung: Da im Allgemeinen die Negation zum Fokus gehört, ist Fk (59a) = *nicht* + *Heinz* und Fk (59b) = *nicht* + *entlassen*; der Rest des Satzes ist jeweils Topik. Das bedeutet, daß bei Äußerung von (59a) ein Äquivalent von (60a) in RK sein muß und bei Äußerung von (59b) ein Äquivalent von (60b); die Verschiedenartigkeit der Annahmen, die Karl durch

	- b. Karl glaubt, daß man mit Heinz etwas gemacht hat

(59a,b) zugesprochen werden, folgt daraus unmittelbar.

Dieses Verhältnis zwischen Logik und Pragmatik wird häufig nicht beachtet. So möchten z. B. Sgall et al. (Sgall et al. 1973; Sgall & Hajicǒvá 1977: 16ff) zeigen, daß Fokusunterscheidungen als Teil der Wahrheitsbedingungen behandelt werden müssen. Ihre eigene Diskussion zeigt aber, daß bei den meisten ihrer Beispiele die verschiedenen kommunikativen Effekte der Sätze aus rein pragmatischen Bedingungen folgen und gerade nicht als verschiedene Wahrheitsbedingungen dargestellt werden dürfen.

Boër behauptet (in einer Arbeit, in der er ansonsten versucht, behauptete logische Unterschiede zwischen verschieden betonten Sätzen auf pragmatische Unterschiede zurückzuführen), daß zwischen Sätzen wie (61a,b) (i) eine echte (nicht-pragmatische) Bedeutungsdifferenz bestehe, der (ii) ein syntaktischer Unterschied in ihren Tiefenstrukturen entspricht, der sich (iii) infolge automatischer (von logischen und pragmatischen Faktoren unabhängiger) Regeln in verschiedenen Betonungen niederschlägt (Boër 1979: 276):

	- b. John shot the *horse* by mistake

Demgegenüber scheint mir, daß es nicht offensichtlich ist, daß (i) (61a,b) verschiedene Wahrheitsbedingungen haben, noch (ii) daß sie verschiedene Tiefenstrukturen haben. Es spricht wohl nichts dafür, daß sie verschiedene Oberflächenstrukturen haben; und (iii) für die Annahme, daß die Betonungsunterschiede von (61a,b) ein automatischer Reflex verschiedener Tiefenstrukturen seien, spricht erst recht nichts. Dagegen ist es offensichtlich, daß Fk (61a) = *shot* und Fk (61b) = *the horse*; demzufolge muß bei einer Äußerung von (61a) ein Äquivalent von (62a) und bei Äußerung von (61b) ein Äquivalent von (62b) in RK

	- b. John hat versehentlich ein Lebewesen erschossen

sein. Die " strongly felt meaning-difference" (Boër 1979: 275) zwischen (61a,b) ist danach zu erwarten. (Andere von Boër diskutierte Beispiele sind z. T. wesentlich komplizierter. Seine pragmatischen Erklärungsversuche scheinen mir im Prinzip richtig zu sein, wenn sie auch mittels der pragmatischen Fokustheorie präzisiert und vereinfacht werden müßten.)

Es ist bekannt, daß je nach Betonung die Bezugsmöglichkeiten anaphorischer Elemente verschieden sein können; vgl. z. B.Akmajian (1973),Akmajian & Jackendoff (1970). Mindestens für die typischen Fälle von pronominalen Anaphern von NPs gibt es aber ohnehin gute Gründe, ihre Interpretation nicht innerhalb der LC zu kennzeichnen; intendierte Koreferenz gehört daher (im Gegensatz zu grammatisch notwendiger Koreferenz wie bei Reflexiv- und Reziprokpronomen) im Allgemeinen nicht zu den grammatisch relevanten logischen Eigenschaften von Sätzen.<sup>19</sup> Etwas anders ist es dort, wo Koreferenz zwischen einer NP und einem Pronomen ausgeschlossen ist. Hier gibt es teilweise grammatische Bedingungen.

	- b. wer liebt seine Mutter?
	- c. keiner liebt seine Mutter
	- b. wer hat behauptet, daß er krank ist?
	- c. keiner von uns glaubt, daß er im Recht ist

Die Annahme (a) beruht m. E. auf einer Verkennung der Aufgaben einer sprachwissenschaftlichen Semantik, (b) auf inkonsequenter Anwendung der Quantifikationstheorie. Vgl. zu diesem Komplex Höhle (in Vorb.).

<sup>19</sup>Dies gilt insbesondere auch für Fälle wie (i) und (ii), wo nach Meinung vieler Logiker bei intendierter Koreferenz (a) die Koreferenz explizit dargestellt werden muß und wo dies (b) nur durch eine gebundene Variable geschehen kann; vgl. z. B. Evans (1980).

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

Chomsky macht in Chomsky (1976a: 340–345) geltend, daß solche Bedingungen in wenigstens einem Fall auch logischer Natur sind: In (63a) ist Koreferenz zwischen *he* und *John* möglich, nicht aber in (63b) zwischen *he* und *someone*. Chomsky nimmt an, daß *he* in dieser syntaktischen Konfiguration nicht koreferent mit einer logischen Variablen sein kann. Da auch in (63c), wo *John* Fokus ist, Koreferenz

	- b. the woman he loved *betrayed* someone
	- c. the woman he loved betrayed *John*

zwischen *he* und *John* ausgeschlossen sein soll, schließt er, daß der Fokus in der LC als logische Variable zu kennzeichnen sei. Hier ist jedoch eine rein pragmatische Analyse der Daten mindestens ebenso gut möglich: In Kontexten wie diesen muß die Referenz von *he* durch den RK gegeben sein.<sup>20</sup> Diese Bedingung ist in (63b) nur gegeben, wenn sich *he* nicht auf *someone* bezieht, da dies – jedenfalls in der naheliegendsten Interpretation – zum Fokus gehört: Fk (63b) = *betrayed* + *someone*. In (63a) ist die Bedingung erfüllt, da Fk (63a) = *betrayed* and demzufolge eine Relation zwischen 'the woman he loves' und John in RK sein muß. Sie ist in (63c) nicht erfüllt, wenn der Satz ohne Kontext gegeben ist: Da Fk (63c) = *John*, kann unter dieser Voraussetzung die Referenz von *he* nicht in RK durch *John* festgelegt sein. In einem Kontext dagegen, wie er durch (64) (= Rochemont 1978: 101 (25)) gegeben ist, ist die Referenz von *he* = *John* bereits in RK gegeben, so daß in diesem Fall Koreferenz zwischen *he* und *John* in (64b) möglich ist, obwohl *John* den Fokus bildet:

	- b. A: No the woman he loves betrayed *John*; Sally and she are the best of friends

Wir werden anhand von Beispielen wie (65) in 1.4.4 sehen, welchen erklärenden Gehalt die rein pragmatische Fokustheorie (37) in Verbindung mit der Theorie konversationeller Implikaturen hat.


<sup>20</sup>In (63) haben wir 'Rückwärts-Pronominalisierung' in einen eingebetteten Satz hinein. Offenbar gilt die gleiche Beschränkung für 'Vorwärts-Pronominalisierung' aus einem eingebetteten Satz heraus: In (i) kann *ihn* eine Anapher des Subjekts des Relativsatzes sein, in (ii) nicht (bzw. wie bei (63) nur dann, wenn Pronomen und 'Antezedens-NP' in RK sind).

### (65) John called Bill a Republican, and then *he* insulted *him*

Für einige einfache Fälle formuliere ich im folgenden Hypothesen zur Generierung der PC. Zweifellos erscheinen diese übermäßig 'oberflächlich'; man würde sich Aussagen wünschen, von denen diese Hypothesen als Theoreme ableitbar wären. Angesichts der Tatsache, daß es in diesem Gebiet so gut wie gar keine sicheren Forschungsergebnisse, aber einen Wust an terminologischen Unklarheiten und loser Spekulation über die Fakten gibt, scheint mir das hier gewählte Verfahren vorteilhaft.

(66) *Hypothese:*

Dann und nur dann wenn ein Satz S*<sup>i</sup> n* betonte Elemente BK enthält, *n ≥* 1, bilden diese BK einen möglichen Fokus. Dies ist der *minimale* Fk<sup>1</sup> (S*i* ).

Diese Hypothese legt sich aufgrund der Beispiele des vorigen Abschnitts nahe; insbesondere müssen in (57) beide betonten Konstituenten im minimalen Fokus sein. Einen minimalen Fokus gibt es (fast) immer als *W*-Fokus; als semantischer Fokus ist er naturgemäß nur möglich, wenn die betonte Konstituente selbst bedeutungstragend ist, also nicht z. B. bei Teilen von idiomatischen Ausdrücken wie in (67):

(67) a. das ist ihm *ein*gefallen? – nein, das ist ihm *auf* gefallen

b. hat sie ihr den *Hof* gemacht? – nein, sie hat ihr den *Garaus* gemacht

Kempson (1975: 192f) verknüpft – allerdings in Hinsicht auf sehr spezielle Beispiele – 'betonte Konstituente' und 'möglichen Kontexttyp' sogar unmittelbar miteinander. Allerdings ist (66) weniger trivial, als es scheinen könnte: Weder Bartsch (1976) noch Smyth et al. (1979) haben die zugrundeliegende Regularität erkannt.<sup>21</sup>

(68) *Hypothese:*

Wenn ein Satz S*<sup>i</sup>* einen möglichen Fokus Fk*<sup>n</sup>* (S*<sup>i</sup>* ) hat, Fk*<sup>n</sup>* (S*<sup>i</sup>* ) *̸*= Fk<sup>1</sup> (S*i* ), dann sind u. a. die BK in Fk*<sup>n</sup>* (S*<sup>i</sup>* ) enthalten.

<sup>21</sup>Die Hypothese (66) gilt in dieser Formulierung für das Deutsche, Englische, Spanische und vermutlich für viele andere Sprachen; man ist geneigt, sie für ein Universale zu halten. Nach Schauber (1978) ist dies jedoch nicht der Fall: Im Navajo wird der Fokus durch die Position verschiedener Affixe festgelegt, offenbar ohne daß dabei die Betonung eine Rolle spielt. (Ähnlich scheint es im Ojibwa zu sein: " Since there are *no supersegmental devices*, nor special morphemes for marking contrastive NPs, Ojibwa is essentially forced to use its word order to mark the contrastiveness of NPs" (Tomlin & Rhodes (1979: 317); Hervorhebung von mir)).

Falls dies zutrifft, ist (66) allenfalls ohne die Klausel " dann und nur dann" ein Universale.

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

Aus (68) und (66) folgt, daß die Fk*<sup>n</sup>* (S*<sup>i</sup>* ) von (68) unbetonte, aber nicht nur unbetonte Konstituenten enthalten. Die BK sind also (echter oder unechter) Teil aller möglichen Foki. Gesamtsätze (sentences) haben, wie es scheint, immer mindestens 1 voll betonte Konstituente. Für Teilsätze (clauses) gilt das jedoch nicht, cf. (69). Folglich hat der *daß*-Satz in (69) keinen möglichen Fokus. Bei den Erörterungen, die folgen, habe ich nur einfache

(69) ich *glaube* nicht daß Heinz den Hund gebissen hat

Sätze im Auge. Ebenso sehe ich von den Verhältnissen innerhalb von Nominalund Präpositionalphrasen ab.

Um die Tatsache terminologisch hervorzuheben, daß nicht-minimale Foki aus einem minimalen Fokus plus zusätzlichen Konstituenten bestehen, ähnlich wie sich im einfachen Fall die LC einer Konstituente aufgrund von Projektionsregeln kompositionell aus den LC ihrer Subkonstituenten ergibt (zu Einschränkungen des strikten Kompositionalitätsprinzips vgl. Höhle (in Vorb.)), führen wir den Begriff 'Fokusprojektion' ein:

	- a. Im Fall von (68) liegt eine *Fokusprojektion* (von Fk<sup>1</sup> (S*i* ) zu Fk*<sup>n</sup>* (S*<sup>i</sup>* )) vor.
	- b. Bedingungen, unter denen eine Fokusprojektion vorliegt, sind *fokusprojektiv*.
	- c. Unter allen möglichen Foki eines Satzes S*<sup>i</sup>* sind die Foki *maximal* (= Fk<sup>m</sup> (S*<sup>i</sup>* )), die die meisten Konstituenten enthalten.
	- d. Wenn in S*<sup>i</sup>* Fk<sup>m</sup> (S*<sup>i</sup>* ) = Fk<sup>1</sup> (S*i* ), liegen nicht-fokusprojektive Bedingungen vor.

Das fundamentale Problem bei allen Untersuchungen zu Fokusphänomenen ist es, Regeln zur Fokusprojektion zu finden. Ein besonders interessantes Teilproblem können wir etwas schärfer formulieren, wenn wir, in Anlehnung an Fuchs (1976: 307f), einen Begriff 'Fokusexponent' einführen:

(71) *Definition:*

Innerhalb einer komplexen Konstituente K*<sup>i</sup>* ist die Konstituente K*<sup>j</sup>* der *Fokusexponent* von K*<sup>i</sup>* , für die gilt: Wenn K*<sup>j</sup>* ein möglicher Fokus von K*<sup>i</sup>* ist, ist auch K*<sup>i</sup>* ein möglicher Fokus; d. h. es gibt eine Fokusprojektion von Fk*<sup>k</sup>* (K*<sup>i</sup>* ) = K*<sup>j</sup>* zu Fk<sup>m</sup> (K*<sup>i</sup>* ) = MK (K*<sup>i</sup>* ).

Das Problem ist dann: Kann man den Fokusexponenten von Konstituententypen generell bestimmen? In Präpositional- und Nominalphrasen scheinen die Verhältnisse in der Tat einfach zu sein: Dort ist anscheinend immer das letzte Substantiv

bzw. – wo vorhanden, der letzte Satz – der Konstituente ihr Fokusexponent. Für Sätze ist die Frage weitaus schwieriger; wie unsere Beispiele zeigen werden, sind wir von einer allgemeinen Lösung weit entfernt. Im übrigen würden durch Regeln für den Fokusexponenten z. B. die Fokusmöglichkeiten von (54) sicherlich noch nicht erfaßt.

Soweit die Rede von 'communicative dynamism' und 'communicative importance' in Sgall et al. (1973), Sgall & Hajicǒvá (1977; 1978) überhaupt verständlich ist, kann man sie vielleicht als Versuch verstehen, eine Basis für die Formulierung von Regeln zur Fokusprojektion zu legen; soweit das Vorhaben erfolgreich ist, könnte man darin vielleicht eine Erklärung (nicht aber ein Indiz) dafür sehen, daß – nach Ansicht vieler Autoren – gewisse Konstituenten 'näher zum Verb gehören' als andere. Die Erfolgsaussichten dieses speziellen Ansatzes scheinen mir jedoch äußerst gering; cf. auch Dahl (1975: 348ff).

Einen interessanten Versuch, die sehr komplexen Zusammenhänge zwischen Betonung, Fokusmöglichkeiten, Wortstellung und semantischer Struktur der Sätze im Spanischen explizit zu erfassen, hat Contreras (1976) unternommen. Auch hier gibt es viele Bedenken im einzelnen, und die Ergebnisse der Arbeit sind allenfalls zum Teil auf das Deutsche anwendbar; am ehesten zu überprüfen wäre die 'Rheme Selection Hierarchy', die festlegt, welche Teile des Satzes unter gegebenen Umständen zum Fokus gehören können (und insofern wahrscheinlich, in meinem Verständnis von Sgall et al. (1973) und Sgall & Hajicǒvá (1977; 1978), einer 'scale of communicative dynamism' entspricht). Aber wegen einer Fülle differenzierter Beobachtungen und der Explizitheit, Kontrollierbarkeit und Konsistenz der Darstellung, die im Gegensatz zu fast der gesamten Literatur über solche Themen steht, ist dies (neben Jackendoff 1972) die Arbeit, an der sich künftige Untersuchungen zu dem Thema zu orientieren haben. (Dabei ist das an der 'generativen Semantik' orientierte Regelwerk von Contreras (1976) leicht in eins zu übersetzen, das Oberflächenstrukturen 'interpretiert'. Ob diese verschiedenen Regelformulierungen rein notationelle Varianten sind oder verschiedene empirische Implikationen haben, ist ein Thema für künftige Untersuchungen.)

Aus (66) und (68) folgt (72):

(72) Wenn zwei Sätze S*<sup>i</sup>* , S*<sup>j</sup>* sich nur dadurch unterscheiden, daß sie verschiedene Betonungen haben, sind die Mengen ihrer möglichen Foki verschieden (MF (S*<sup>i</sup>* ) *̸*= MF (S*<sup>j</sup>* )).

Auch wenn sowohl in S*<sup>i</sup>* als auch in S*<sup>j</sup>* fokusprojektive Bedingungen vorliegen, so daß unter Umständen für alle nicht-minimalen Foki Fk*<sup>n</sup>* (S*<sup>i</sup>* ) = Fk*<sup>n</sup>* (S*<sup>j</sup>* ) gilt, ist doch in jedem Fall Fk<sup>1</sup> (S*i* ) *̸*= Fk<sup>1</sup> (S*j* ). (In dem Fall daß Fk<sup>1</sup> (S*i* ) = Fk*n*(S*<sup>j</sup>* ), ist immer noch Fk<sup>1</sup> (S*j* ) nicht in MF (S*<sup>i</sup>* ).)

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

Die je nach Betonung mögliche Menge der Foki wird weiter dadurch eingeschränkt, daß empirisch die Betonung verschiedener Konstituenten offenbar niemals in gleicher Weise fokusprojektiv ist:

(73) *Hypothese:*

Wenn zwei Sätze S*<sup>i</sup>* , S*<sup>j</sup>* sich nur durch ihre Betonung unterscheiden und es in S*<sup>i</sup>* eine Fokusprojektion von Fk*<sup>i</sup>* (S*i* ) = K*<sup>j</sup>* zu Fk*<sup>n</sup>* (S*<sup>i</sup>* ) = K*<sup>j</sup>* + K*<sup>k</sup>* gibt, dann gibt es in S*<sup>j</sup>* keine Fokusprojektion von Fk*<sup>j</sup>* (S*j* ) = K*<sup>k</sup>* zu Fk*<sup>n</sup>* (S*<sup>j</sup>* ) = K*<sup>j</sup>* + K*<sup>k</sup>* (für Fk*<sup>i</sup>* (S*i* ) *∩* Fk*<sup>j</sup>* (S*j* ) = *∅*).

Die Hypothese ist so formuliert, daß sie die Projektion von verschiedenen Foki (K*<sup>j</sup>* bzw. K*k*) zu aus diesen verschiedenen Foki kombinierten gleichen Foki (K*<sup>j</sup>* + K*k*) verbietet; betrachten wir als Beispiel dazu noch einmal (48) vs. (54):


Wir haben früher gesehen, daß es in (48) eine Fokusprojektion von Fk<sup>1</sup> (48) = *Buch* zu Fk<sup>2</sup> (48) = *Buch* + *geschenkt* gibt. In (54) ist Fk<sup>1</sup> (54) = *geschenkt*; (73) sagt korrekt voraus, daß es keinen Fk*<sup>n</sup>* (54) = *Buch* + *geschenkt* gibt (obwohl die Betonung in (54) fokusprojektiv ist: Es gibt den Fk<sup>2</sup> (54) = *Karl* + *geschenkt*). (73) verbietet jedoch nicht den Fall, daß es eine Projektion von partiell gleichen Foki (etwa Fk*<sup>l</sup>* (S*i* ) = K*<sup>i</sup>* + K*<sup>j</sup>* und Fk*<sup>m</sup>* (S*<sup>j</sup>* ) = K*<sup>j</sup>* + K*k*) zu einem gleichen Fokus K*<sup>i</sup>* + K*<sup>j</sup>* + K*<sup>k</sup>* gibt; einen solchen Fall haben wir in (58b). Auch die Projektion von gleichen Foki zu gleichen Foki ist natürlich erlaubt; vgl. (58c). Vgl. dazu (105).

An dieser Stelle muß auf eine Mehrdeutigkeit des Ausdrucks " verschiedene/ gleiche Betonung" aufmerksam gemacht werden. Man kann sagen, daß zwei Sätze die gleiche Betonung haben, wenn sie die gleiche Abfolge von betonten und unbetonten Konstituenten haben. Oder man kann von gleicher Betonung sprechen, wenn die gleichen Satzteile betont sind. Im ersten Fall spreche ich von gleichem 'Betonungsmuster', im zweiten von gleicher 'Konstituentenbetonung'. So haben wir in (74a,b) das gleiche Betonungsmuster, in (74b,c) dagegen die gleiche Konstituentenbetonung:

	- b. den Hund hat *Karl* gestreichelt
	- c. *Karl* hat den Hund gestreichelt

Für (72) und (73) ist diese Unterscheidung ohne Belang, aber man muß beachten, daß in topologischen Untersuchungen gewöhnlich das Betonungsmuster, im Gegensatz zur Konstituentenbetonung, konstant gehalten wird; andernfalls wären

z. B. Kirkwoods Äußerungen in (4) überhaupt nicht verständlich. Beim Vergleich von aktiven und passiven Konstruktionen gilt etwas ähnliches: Man findet häufig Behauptungen des Inhalts, daß etwa (75a,b) sich hinsichtlich der Topik-Fokus-Gliederung unterscheiden. Die Beurteilung passiver Sätze ist oft recht schwierig, aber hier ist diese Behauptung richtig, wenn das Betonungsmuster konstant bleibt, so daß in (75a,b) jeweils die dritte Konstituente betont ist, wie in (75c,d). Wenn jedoch die Konstituentenbetonung konstant gehalten wird, also auf dem logischen Objekt (75c,e)) oder auf dem Verb (75d,f), ergeben sich keine Unterschiede in den Fokusmöglichkeiten, d. h. in (75c,e) kann der ganze Satz den Fokus bilden, in (75d,f) nur das Verb.

	- b. der Hund ist getreten worden
	- c. jemand hat den *Hund* getreten
	- d. der Hund ist *getreten* worden
	- e. der *Hund* ist getreten worden
	- f. jemand hat den Hund *getreten*

Um eine kurze Ausdrucksweise zur Hand zu haben, führe ich folgende Notationen ein:

	- b. ES*<sup>i</sup>* : eine Menge von Sätzen S*i*<sup>1</sup> , S*i*<sup>2</sup> , …, S*in* , die sich (bei gleicher Konstituentenbetonung und abgesehen von möglichen Foki) nur hinsichtlich der linearen Abfolge der Konstituenten unterscheiden
	- c. EBS*<sup>i</sup>* : eine Menge von Sätzen S*i*<sup>1</sup> , S*i*<sup>2</sup> , …, S*in* , die sich (abgesehen von möglichen Foki) nur hinsichtlich der linearen Abfolge der Konstituenten und/oder der Konstituentenbetonung unterscheiden

Diese Mengen sollen vollständig sein: Wenn zwei Sätze S*<sup>i</sup>* , S*<sup>j</sup>* sich nur hinsichtlich der Konstituentenbetonung unterscheiden und S*<sup>j</sup>* in EB*<sup>i</sup>* ist, dann ist auch S*<sup>i</sup>* in EB*<sup>i</sup>* ; entsprechend für ES*<sup>i</sup>* und EBS*<sup>i</sup>* . Für alle *i* und *j*: Wenn *i* = *j*, dann EB*<sup>i</sup> ⊆* EBS*<sup>j</sup>* und ES*<sup>i</sup> ⊆* EBS*<sup>j</sup>* .

Aus (37) und (72) folgt (77):

(77) Wenn zwei Sätze S*<sup>i</sup>* , S*<sup>j</sup>* in EB*<sup>i</sup>* sind, sind die Mengen von Kontexttypen, in denen sie vorkommen können, verschieden.

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

Dabei ist ein 'Kontexttyp' die Menge MRK*<sup>i</sup>* von relevanten Kontexten, die, für einen gegebenen Satz S*<sup>i</sup>* bei einem gegebenen Fk*<sup>j</sup>* (S*i* ), gemäß (37a) einen Satz S W *<sup>i</sup>* oder gemäß (37b) die Konjunkte der normalisierten LC von S*<sup>i</sup>* enthalten, die dem Tk*<sup>j</sup>* (S*i* ) entsprechen. (Vgl. (38). N.B.: Wenn dort z. B. das 3. oder 4. Konjunkt einem Teil des Topiks entspricht, ist immer auch das 1. Konjunkt in RK; der Ausdruck des 3. (bzw. 4.) Konjunkts wäre sonst sinnlos.)

Während jede solche Menge MRK*<sup>i</sup>* natürlich infinit ist, ist die Anzahl der MRK*<sup>i</sup>* pro Satz S*<sup>i</sup>* gleich der Anzahl der möglichen Topiks von S*<sup>i</sup>* , wenn wir im Fall eines topiklosen Satzes ein 'leeres' Topik mitzählen.

(78) *Definition:*

Unter den Sätzen in EB*<sup>i</sup>* sind die S*<sup>j</sup> kontextuell relativ unmarkiert* hinsichtlich der Betonung, die in der größten Zahl von Kontexttypen vorkommen können; alle anderen S*<sup>k</sup>* in EB*<sup>i</sup>* sind hinsichtlich der Betonung kontextuell markiert.

Der Sinn dieser Definition dürfte klar sein. Wenn es je nach Betonung verschieden viele mögliche Foki gibt, dann ist der Satz, der die meisten möglichen Foki hat, im Vergleich zu den anders betonten Sätzen kontextuell am wenigsten eingeschränkt. Ein Satz, der nur aus einem Wort besteht, etwa *geh!*, ist trivial unmarkiert.

Wir können jetzt den in (30) gebrauchten Begriff 'stilistisch normale Betonung' explizieren:

(79) Die Betonung eines Satzes S*<sup>i</sup>* ist stilistisch normal, wenn S*<sup>i</sup>* hinsichtlich der Betonung kontextuell relativ unmarkiert ist; sie ist stilistisch nicht-normal, wenn S*<sup>i</sup>* hinsichtlich der Betonung kontextuell markiert ist.

Unter den Beispielen, die wir in 1.3.2 betrachtet haben, ist allein (48) hinsichtlich der Betonung kontextuell relativ unmarkiert, da er die meisten möglichen Foki hat und daher in den meisten Kontexttypen vorkommen kann. Eben dieser Satz weist auch eine Betonung auf, die, im Unterschied zu alternativen Betonungsmustern, allgemein als stilistisch normal empfunden wird.

### **1.4 Fruchtbarkeit der Explikation**

Ich möchte auf einige Eigenschaften dieser Explikation von " Normalbetonung" eingehen.

### **1.4.1 Adäquatheit**

Wenn man die intuitiv wirklich klaren Fälle von 'normaler' und 'nicht-normaler' Betonung untersucht, zeigt sich, daß (79) die Unterscheidung in genauer Überein-

stimmung mit der Intuition vornimmt. Der Zusammenhang zwischen 'Normalbetonung' und relativ großem Umfang des Fokus ist in der Literatur mehrfach beobachtet worden. Die – terminologisch komplizierten und teilweise recht unklaren – Ausführungen von Halliday verstehe ich in genau diesem Sinne, so z. B.:

" A specific question is derivable from any information unit except one with unmarked focus; one with unmarked focus does not imply any preceding information […] Where the focμs is unmarked, […] its domain may be the whole of the information unit. An item with unmarked focus may thus be represented as being ambiguous, as having the structure either given – new or simply new." (Halliday 1967: 208)

Ähnlich Chomsky, z. B.:

" This […] suggests that when expressive or contrastive stress shifts intonation center, the same principle applies as in normal cases for determining focus and presupposition, but with the additional proviso that naturalness declines far more sharply as larger and larger phrases containing the intonation center are considered as a possible focus." (Chomsky 1976b: 98f)

Wenn ich die – in wesentlichen Teilen höchst unklaren – Ausführungen von Sgall et al. (1973) richtig verstehe, machen auch sie diese Beobachtung: Bei 'normaler' Betonung kann der Fokus umfangreich sein, während er bei 'nicht-normaler' Betonung eingeschränkt ist.

Dabei kann es bei allen Autoren nicht um den Umfang des Fokus als solchen gehen. In (80) z. B. ist der ganze Satz (minimaler) Fokus,

(80) *Karl* hat den *Hund getreten*

aber keiner der Zitierten betrachtet diese Betonung als normal. Das entscheidende Faktum ist offensichtlich, daß bei Normalbetonung der Fokus wesentlich mehr umfaßt bzw. umfassen kann als eine einzige betonte Konstituente, wenn also Fokusprojektion – bei Fuchs (1976: 301ff): 'Integration' – vorliegt (soweit überhaupt eine theoretische Möglichkeit dafür gegeben ist).<sup>22</sup>

<sup>22</sup>Unter 'emphatisch' oder 'kontrastiv' betonten Sätzen verstehen die meisten Autoren offenbar solche, die gemäß (79) hinsichtlich der Betonung kontextuell markiert sind; insbesondere jene kontextuell markierten Sätze, die nur einen einzigen möglichen Fokus haben (wenn der Satz mehr als 1 Konstituente hat). Nach dieser Explikation wäre (80) als emphatisch und/oder kontrastiv zu bezeichnen.

In Fuchs (1980: §2.3) sagt Fuchs allerdings, Fälle wie (i) seien im Verhältnis zu (ii) keineswegs 'neutral' oder 'unmarkiert'; vielmehr sei der Typ (i) " more restricted, more specific":

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

Die gegebene Explikation ist noch in einer anderen Hinsicht adäquat: insofern sie auf die Zahl *möglicher* Foki von *Sätzen* abgestellt ist und nicht auf Äußerungen. Altmann bezieht in dem Zitat unter (28) die 'Normalität' einer Betonung auf den Gebrauch von Sätzen, d. h. auf Äußerungen. Eine Äußerung hat immer genau 1 intendierten Fokus, und man kann nur prüfen, ob die Äußerung konversationellen Maximen entsprechend im gegebenen Kontext 'passend' ist oder nicht. Da die 'Normalität' einer Betonung aber ersichtlich mit der Art und Zahl möglicher Foki zusammenhängt, kann sie primär nur für Sätze, nicht für Äußerungen definiert werden. Anders gesagt: Wer 'Normalbetonung' primär auf Äußerungen und nicht auf Sätze bezieht (also mit 'kontextuell angemessen' identifiziert), muß zu dem paradoxen Schluß kommen, daß die " Annahme eines Normalakzents für jeden satzwertigen Ausdruck […] theoretisch nicht haltbar ist", obwohl sie sich " auf tiefwurzelnde Intuitionen stützen kann", vgl. (28) – aber ein solches Schlußverfahren entzieht der empirischen Sprachforschung den Boden. (Aber man kann 'Normalbetonung' natürlich auch für Äußerungen definieren: Eine Äußerung von S*<sup>i</sup>* hat stilistisch normale Betonung, wenn S*<sup>i</sup>* stilistisch normale Betonung hat.)

### **1.4.2 Nützlichkeit**

Die in (79) gegebene Explikation von " Normalbetonung" ersetzt das Explikandum durch ein Explikans, das (a) präziser bestimmt und (b) empirisch besser

<sup>(</sup>i) der *Junge* kommt

<sup>(</sup>ii) der *Junge kommt*

Sie gibt zwei Typen von Argumenten dafür: (a) " Taking placement in discourse into account, [(i)] has far more limited possibilities of occurrence than [(ii)], and a much more specific meaning (or discourse function)." Soweit " placement in discourse", " meaning" und " discourse function" mir verständlich erscheinen, ist diese Behauptung schlechterdings falsch: (i) hat 2 mögliche Foki (vgl. (83)), (ii) nur 1, so daß (i) in mehr Kontexttypen vorkommen kann als (ii). (b) Der Typ (i) sei hinsichtlich seines syntaktischen Aufbaus und seiner prosodischen Möglichkeiten stärker beschränkt als der Typ (ii). Hinsichtlich des 'syntaktischen Aufbaus' ist das irreführend. Zwar kommt Fokusprojektion vom Subjekt zum Satz nur bei einigen Prädikaten vor; aber genauso gut könnte man sagen, daß nur bei einigen Prädikaten Fokusprojektion vom Prädikat zum Satz vorkommt. Außerdem läßt Fuchs hier die allgemeine Regel (115) außer Acht. Hinsichtlich der prosodischen Eigenschaften mag die Behauptung stimmen. Dies hat jedoch mit *intuitiver* (stilistischer) Unmarkiertheit, um die es hier geht, nichts zu tun; es ist allenfalls für einen Begriff der *strukturellen* (Un-)Markiertheit relevant. (Nicht ohne Grund bezeichnen fast alle von Fuchs zitierten Autoren (i) als 'normal', ohne (ii) überhaupt zu berücksichtigen.) Wir besprechen in Abschnitt 3, daß derartige strukturelle Markiertheitsbegriffe streng von Begriffen der stilistischen Markiertheit unterschieden werden müssen und, im Gegensatz zu diesen, von sehr zweifelhafter Relevanz sind.

kontrollierbar ist. (Die in 1.4.1 zitierten Autoren setzen wohlgemerkt 'Normalbetonung' immer als undefinierten Begriff voraus und teilen empirische Beobachtungen über Fälle mit 'Normalbetonung' mit. In (79) ist es umgekehrt: Empirisch kontrollierbare Phänomene werden zur Explikation von " Normalbetonung" verwendet.)

Diese Explikation ermöglicht es, eine Reihe von Zweifelsfällen zu klären. Untersuchen wir einige Beispiele aus 1.1, hier mit neuer Numerierung wiederholt.

Zunächst zu Beispielen, die für Bartschs Aussagen über 'Normalbetonung' von Belang sind:

	- b. daß der Junge *getanzt* hat (= (2c))

Hier haben wir die minimalen Foki Fk<sup>1</sup> (81a) = *der Junge* und Fk<sup>1</sup> (81b) = *getanzt*. Gibt es eine Fokusprojektion? Betrachten wir die Diskurse in (82):

(82) a. A: was ist geschehen, als die Nachricht eintraf?

b. B: (81a)

c. B: (81b)

Auf die Frage (82a) kann mit (81b) geantwortet werden, wenn mehrere Leute, darunter der Junge, die Nachricht gehört haben und nicht zu erwarten war, daß gerade der Junge etwas Besonderes tun würde. Mit (81a) kann offenbar nur geantwortet werden, wenn zu erwarten oder bekannt war, daß jemand tanzt. In (81a) ist *getanzt* also notwendig Topik, in (81b) dagegen haben wir Fk<sup>2</sup> (81b) *der Junge* + *getanzt*. Demnach hat (81b) mehr mögliche Foki als (81a) und ist im Unterschied zu (81a) nach (79) normalbetont, entgegen der Aussage von Bartsch.

Allerdings ist es seit Hatcher (1956; 1972) wohlbekannt, daß andere einstellige Prädikate sich anders verhalten, vgl. z. B. Heidolph (1970: 81 Fn. 8), Schmerling (1976: 41ff), Fuchs (1976), Allerton & Cruttenden (1979). Auf diese treffen Bartschs Aussagen zu, vgl.:

	- b. es heißt, daß der Junge *kommt* (= (2d))

In (83a), aber nicht in (83b), ist eine Fokusprojektion zu *der Junge* + *kommt* möglich, so daß in diesem Fall die Betonung des Subjekts stilistisch normal ist.

Weniger bekannt ist, daß es ähnliche Unterschiede auch bei zweistelligen Verben gibt. So ist in (84) die Betonung des Objekts

(84) a. es heißt, daß der Junge dem *Pfarrer* begegnet ist (= (1b)) b. es heißt, daß der Junge dem Pfarrer *begegnet* ist (= (2b))

3 Explikationen für "normale Betonung" und "normale Wortstellung"

stilistisch normal; vgl. die MF (84a) in (85) mit der MF (84b) in (86):

	- b. Fk<sup>2</sup> (84a) = dem Pfarrer + begegnet
	- c. Fk<sup>3</sup> (84a) = MK (84a) = der Junge + dem Pfarrer + begegnet

(86) Fk<sup>1</sup> (84b) = Fk<sup>m</sup> (84b) = begegnet

Anders als Bartsch es postuliert verhält sich (87). Wie die MF (87a) in (88) und die MF (87b) in (89) ausweisen, scheint hier die Betonung

(87) a. es heißt, daß die Theorie den *Fach*leuten gefallen hat (= (1a)) b. es heißt, daß die Theorie den Fachleuten *gefallen* hat (= (2a))

des Verbs stilistisch normal, die des Objekts nicht-normal zu sein:

	- b. Fk<sup>2</sup> (87b) = den Fachleuten + gefallen
	- c. Fk<sup>3</sup> (87b) = MK (87b) = die Theorie + den Fachleuten + gefallen

Es scheint, daß die Projektionsmöglichkeiten nicht nur vom Prädikatstyp, sondern auch vom internen Aufbau des Objekts beeinflußt werden. So erlauben (90a) wie (90b) eine Fokusprojektion;

	- b. er hat (sogar) ein *Buch* verbrannt

dies scheint auch bei (91a) der Fall zu sein, aber nicht bei (91b):

	- b. er hat (sogar) ein *Buch* über Mozart verbrannt

(vgl. Erteschik-Shir (1981), wo ähnliche Unterschiede für das Englische diskutiert werden).

Gehen wir zu Kiparskys Beispiel (92) über. Der Satz paßt zu den

(92) der Arzt wird den Patienten unter*suchen* (= (3))

Fragen (93), also Fk<sup>1</sup> (92) = *untersuchen* und Fk<sup>2</sup> (92) = *der Arzt* + *untersuchen*. Vergleichen wir damit (94); dieser Satz paßt zu den


	- b. was wird der Arzt tun?
	- c. was wird geschehen?

Fragen (95), also Fk<sup>1</sup> (94) = *Patienten*, Fk<sup>2</sup> (94) = *Patienten* + *untersuchen*, Fk<sup>3</sup> (94) = MK (94). Da (94) mehr mögliche Foki hat als (92), ist (92) nach (79), entgegen Kiparskys Meinung, aber in Übereinstimmung mit dem intuitiven Urteil vieler Sprecher, nicht-normal betont.

Betrachten wir Kirkwoods Beispiele. Man überzeugt sich leicht, daß für (96) das gleiche gilt wie für (48), d. h. wir haben die MF (96) in (97). Unter allen möglichen Betonungsmustern für diese Wortfolge hat (96) die meisten möglichen Foki; nach (79) ist der Satz damit normal betont.

	- b. Fk<sup>2</sup> (96) = gab + das Buch
	- c. Fk<sup>3</sup> (96) = gab + dem Kind + das Buch
	- d. Fk<sup>4</sup> (96) = er + gab + das Buch
	- e. Fk<sup>5</sup> (96) = MK (96) = er + gab + dem Kind + das Buch

Wie ist es bei (98)? Der Satz paßt zu den Fragen in (99), hat also die MF (98) in (100), die z. T. mit den Foki von (96) identisch sind.

	- b. was hat er mit dem Buch gemacht? (cf. (49j))
	- c. was hat er getan?
	- d. was ist mit dem Buch geschehen?
	- e. was ist geschehen?

$$\text{(100)}\qquad \text{a.}\quad \text{Fk}\_1 \text{ (98)} = \text{dem Knot}$$


Unter allen möglichen Betonungsmustern für diese Wortfolge hat (98) die meisten möglichen Foki; unter der Explikation (79) ist (98) daher in genau derselben

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

Weise normal betont wie (96); für Kirkwoods und Griesbachs Annahme, in Fällen wie (98) liege nicht-normale Betonung vor, sehe ich keine Grundlage.

Bartsch sagt zwar, daß in (96) wie in (98) in gleicher Weise 'standard intonation pattern' vorliege, leugnet aber (Bartsch 1976: 523), daß in (98) das Akkusativobjekt Teil eines Fokus (wie in (100c)) sein kann. (Die Möglichkeit, daß das Subjekt bei mehrstelligen Verben im Fokus ist wie in (50e) oder (97d,e) und (100d,e), läßt sie ausdrücklich nicht zu, vgl. Bartsch (1976: 522). Für 1-stellige Verben sind die Implikationen ihrer Fokustheorie nicht klar.) Natürlich muß man bei Fragen der Fokuseruierung wie in allen anderen Fällen, in denen die Intuitionen von Sprechern eine Rolle spielen, im Prinzip mit gewissen idiolektalen Unterschieden rechnen. In diesem speziellen Fall bin ich aber davon überzeugt, daß die drei genannten Autoren sich nicht von empirischen Beobachtungen, sondern von gewissen Traditionen des Schulunterrichts haben leiten lassen.<sup>23</sup>

Für (101a,b) gilt dasselbe wie für (96), (98); wir können Lenerz zustimmen, daß Normalbetonung vorliegt. Gilt das auch für (101c)? In (102) formuliere ich einige Fragen, um zu prüfen, ob (101c) zu ihnen passen könnte. Es scheint mir – besonders im Vergleich zu (101a) – ganz deutlich, daß (101c) zu keiner der Fragen (102b–e)

	- b. ich habe dem Kassierer das *Geld* gegeben (= (3a) in (5))
	- c. ich habe dem *Kassierer* das Geld gegeben (= (2a) in (5))
	- b. was hast du mit dem Geld gemacht?
	- c. was ist mit dem Geld geschehen?
	- d. was hast du dann getan?
	- e. was ist dann geschehen?

paßt, also nur den minimalen Fokus *dem Kassierer* hat. Unter der Explikation (79) hat (101c) also (da (101b) bei gleicher Wortfolge mehr Foki hat) eine entschieden


<sup>23</sup>Möglicherweise liegt auch eine Übergeneralisierung vor. Denn während es scheint, daß die Fokusmöglichkeiten bei *geb-* und *schenk-* so sind, wie ich in (97) und (100) angegeben habe, verhalten sich andere 3-stellige Verben offenbar anders. Bei *zeig-* z. B. scheint mir nur in (i), nicht aber in (ii), ein Fokus möglich, der – parallel zu (100c,e) – die beiden Objekte und das Verb enthält:

nicht-normale Betonung, entgegen der Ansicht von Lenerz, aber in Übereinstimmung mit der Intuition vieler Sprecher.

### **1.4.3 Heuristische Fruchtbarkeit**

Die Explikation (79) ist infolge des Systems von Hypothesen und Definitionen, auf dem sie aufbaut, direkt mit einer Fülle von empirisch interessanten Fragen verknüpft, die so entweder zuvor nicht gestellt worden sind oder nicht in kontrollierbarer Weise einer Antwort nähergebracht werden konnten; in vielen Fällen legt sie die Antworten unmittelbar nahe; z. B.:


Der letztgenannten Frage wenden wir uns weiter unten zu; vorher wollen wir einige Spezialfälle der Fokusprojektion betrachten.

Zur partiellen Erklärung der Unterschiede zwischen (48) und (57) legen sich die folgenden Generalisierungen nahe.

(103) *Hypothese:*

Bei gewissen dreistelligen Verben und der Wortfolge

Subjekt *>* Objekt *>* Objekt

ist, wenn die Objekte definite nicht-pronominale Nominalphrasen sind, das letzte Objekt Fokusexponent von S.

(Dabei drückt " A *>* B" aus, daß B auf A linear folgt. Die Relation ist asymmetrisch und transitiv.)

In dieser Formulierung ist (103) für (48) und (57) ebenso anwendbar wie für (104a,b):

3 Explikationen für "normale Betonung" und "normale Wortstellung"

	- b. Karl hat das *Buch* dem *Kind* geschenkt
	- a. *Jede* Betonung eines Fokusexponenten von K*<sup>i</sup>* führt dazu, daß es einen Fk<sup>m</sup> (K*<sup>i</sup>* ) = MK (K*<sup>i</sup>* ) gibt.
	- b. In jedem Satz S*<sup>i</sup>* ist in jedem nicht-minimalen Fokus Fk*<sup>n</sup>* (S*<sup>i</sup>* ) das Verb enthalten.

Wenn in einem Satz S*<sup>i</sup>* nur der Fokusexponent von S betont ist (und dieser in S*<sup>i</sup>* nicht das Verb ist), folgt aus (105b), daß Fk<sup>2</sup> (S*<sup>i</sup>* ) = Fk<sup>1</sup> (S*i* ) + Verb und (gegebenenfalls) Fk<sup>3</sup> (S*<sup>i</sup>* ) = Fk<sup>2</sup> (S*<sup>i</sup>* ) + K*<sup>j</sup>* . Aus (105a) folgt, daß diese Regel für (48) und (104a) in derselben Weise anzuwenden ist wie für (57) und (104b). Aus (103), (105) und (66) folgt dann, daß (48) mindestens die Foki (50a,b,e) hat und daß (57) mindestens die Foki (58a,b,c) hat. Aus (105) und

### (50) a. Fk<sup>1</sup> (48) = das Buch

	- b. Fk<sup>2</sup> (57) = dem Kind + das Buch + geschenkt (= Fk<sup>3</sup> (48))
	- c. Fk<sup>3</sup> (57) = MK (57) = Karl + dem Kind + das Buch + geschenkt (= Fk<sup>5</sup> (48))

(66) folgt, daß (57) höchstens die Foki von (58) haben kann, insbesondere nicht etwa Fk*<sup>n</sup>* (57) = *Karl* + *dem Kind* + *das Buch*; ebenso sind für (48) die denkbaren Foki *dem Kind* + *das Buch* (= Fk<sup>1</sup> (57)), *Karl* + *das Buch* und *Karl* + *dem Kind* + *das Buch* ausgeschlossen. Wir haben keine Hypothese formuliert (und wollen dies hier auch nicht tun), aus der folgt, daß (48) die Foki (50c,d) hat; aber alle anderen Eigenschaften von (48) und (57) folgen aus unseren Annahmen. Sinngemäß gilt das gleiche für (104a,b).

Zur Illustration zwei weitere Vergleiche. Zu (106) passen die Fragen (107); die entsprechenden Foki sind in (108) angegeben.

(106) *Karl* hat dem Kind das *Buch* geschenkt

	- b. wer hat hinsichtlich des Kindes was getan? was hat das Kind erlebt?
	- c. was ist geschehen?
	- b. Fk<sup>2</sup> (106) = Karl + das Buch + geschenkt (= Fk<sup>4</sup> (48))

c. Fk<sup>3</sup> (106) = MK (106) = Karl + dem Kind + das Buch + geschenkt (= Fk<sup>5</sup> (48))

Aus (103), (105) und (66) folgt, daß (106) genau diese Foki hat.<sup>24</sup>

Zu (109) passen die Fragen in (110), daher die Foki von (111). Aus den Hypothesen folgt, daß (109) mindestens die Foki (111a,d) hat; wie bei (50c,d) wird auch hier nicht vorausgesagt, daß die Foki (111b,c) existieren.

	- b. was hat Karl getan?
	- c. was hat das Kind erlebt?
	- d. was ist geschehen?
	- b. Fk<sup>2</sup> (109) = dem Kind + das Buch + geschenkt (= Fk<sup>3</sup> (48))
	- c. Fk<sup>3</sup> (109) = Karl + das Buch + geschenkt (= Fk<sup>4</sup> (48))
	- d. Fk<sup>4</sup> (109) = MK (109) = Karl + dem Kind + das Buch + geschenkt (= Fk<sup>5</sup> (48))

Gehen wir noch kurz auf den Unterschied zwischen (112a,b) ein. Unter der Voraussetzung, daß die Betonung in (112a) fokusprojektiv ist, existieren nach (66) und (105) die Foki von (113). Unter derselben Voraussetzung

	- b. Karl hat den Hund *geschlagen*

(i) ich suche den *blonden* Mann mit dem großen *Auto*.

<sup>24</sup>Die Hypothese (105a) gilt offenbar nicht innerhalb von Nominalphrasen (zu komplexen NPs vgl. allgemein Abraham (1977) und Fuchs (1976)). In der NP *den blonden Mann mit dem großen Auto* ist das letzte Substantiv *Auto* zunächst Fokusexponent der PP *mit dem großen Auto* und indirekt der ganzen NP. Bei einer Betonung wie in (i) gibt es jedoch keine Fokusprojektion zu MK (NP), sondern nur den minimalen Fokus Fk1 (i) = *blonden* + *Auto*:

3 Explikationen für "normale Betonung" und "normale Wortstellung"

	- c. Fk<sup>3</sup> (112a) = MK (112a) = Karl + den Hund + geschlagen
	- b. Fk<sup>2</sup> (112b) = Karl + geschlagen

(daß es in (112a) eine Fokusprojektion gibt) ist nach (73) für (112b) ein Fokus Fk*<sup>n</sup>* (112b) = *den Hund* + *geschlagen* ausgeschlossen, so daß nur die Foki (114) theoretisch möglich sind. Diese Voraussagen der Hypothesen stimmen mit den empirischen Fakten genau überein.

Wir haben einige Fragen im Zusammenhang mit Fokusexponenten betrachtet. Kommen wir nun zu der Frage, was die Unterscheidung von Topik und Fokus mit der Unterscheidung von 'alt' und 'neu' zu tun hat. Sie ist dadurch motiviert, daß man in vielen Ausführungen zur Topik-Fokus-Unterscheidung Bestimmungen der Art findet, daß der Fokus 'neue Information' enthalte, während im Topik 'gegebene (alte) Information' enthalten sei. Wenn man das z. B. auf den minimalen Fokus von (48) *das Buch* anwendet, erhebt sich die Frage, in welchem Sinne eine Nominalphrase überhaupt 'Information' enthalten soll. Am ehesten wird man darunter verstehen, daß durch die NP ein bis dahin unbekannter Referent in den Diskurs eingeführt wird. Das kann mit definiten NPs wie *das Buch* im Allgemeinen jedoch nicht geschehen; deren Verwendung setzt im Allgemeinen voraus, daß ihr Referent aus RK bekannt ist.<sup>25</sup> In diesem Sinne kann daher *das*

(i) Karl wußte, daß das Leben in Norwegen teuer ist

verwendet werden, um dem Hörer/Leser mitzuteilen, daß das Leben in Norwegen teuer ist; entsprechend z. B. bei (ii.a), etwa als Antwort auf (ii.b), oder in (iii.b) im Kontext (iii.a):

(ii) a. Karl freut sich, daß sein Freund zu Besuch kommt b. warum ist Karl so vergnügt?

<sup>25</sup>Dies gilt für NPs wie *das Buch*, aber nicht für definite NPs schlechthin. Mit Ausdrücken wie *mein Sohn, mein Nachbar, der Chef meiner Frau* kann ohne weiteres ein neuer Referent in den Diskurs eingeführt werden. Starke Beschränkungen für diese Verwendung definiter NPs gibt es bei Eigennamen. Zu einigen Aspekten solcher Fälle vgl. Prince (1978; 1981). – Definite Personalpronomen können überhaupt nur gebraucht werden, wenn ihr Referent aus RK bekannt ist, d. h. wenn er aufgrund des weiteren Kontexts identifizierbar ist wie in (63a), (64b) oder aber auf eine 'koreferente' NP in einem anderen Teil-Satz (clause) des gleichen Satzgefüges folgt wie z. B. in (ii) von Fn.19. (Das sind notwendige Bedingungen, nicht hinreichende.)

Während es für definite NPs in dieser Hinsicht gewisse Gebrauchsbeschränkungen gibt, sind präsupponierte Sätze völlig frei. Sie können nicht nur dann im Fokus stehen, wenn ihre Funktion im Satzgefüge nicht aus RK bekannt ist, sondern auch zur Vermittlung neuer Information dienen. So kann (i)

*Buch* nicht 'neue Information' sein. (Diese Kritik ist häufig erhoben worden, cf. z. B. Weiss (1975)). 'Neu', d. h. nicht aus RK bekannt, ist vielmehr, wie wir in (32) ausgeführt haben, die Information, daß bei dem Vorgang des Schenkens, bei dem Karl als Agens und das Kind als Empfänger beteiligt waren, *das Buch* als Objekt betroffen war, d. h. die Funktion, die *das Buch* in (48) hat.<sup>26</sup>

Definite Nominalphrasen können also im Allgemeinen ohne weiteres im Fokus sein; es gibt gar keinen Grund, warum dies anders sein sollte. Für Personalpronomen gilt empirisch jedoch eine eigenartige Regularität, die man wie in (115) formulieren kann:

### (115) *Hypothese:*

Wenn zwei Sätze S*<sup>i</sup>* , S*<sup>j</sup>*


b. da es Maria bedrückte, daß sie Karl nicht helfen konnte, fühlte sie sich unglücklich

Wir wissen aus der Diskussion im Zusammenhang mit (43b), daß die Elemente von RK nicht notwendig von Sprecher und Hörer als wahr akzeptiert werden, und wir sehen hier, daß Propositionen, die der Sprecher notwendig als wahr akzeptiert, nicht Elemente von RK sein müssen. 'Relevanter Kontext' und 'logische Präsupposition' sind also nicht nur definitorisch, sondern auch empirisch völlig verschiedene Gegenstände. Vgl. die ausführliche Diskussion in Reis (1977: 3.3.3).

(Unter manchen sprachwissenschaftlichen Präsuppositionstheorien, die die Existenzpräsupposition von Eigennamen und die Wahrheitspräsupposition von faktiven Nebensätzen als essentiell gleiches Phänomen behandeln, ist dieser Unterschied überraschend. Ganz anders in Freges Theorie der Nebensätze: Der Gedanke, daß ein gegebener Eigenname etwas bezeichnet, ist nicht Teil des Gedankens, den ein Satz ausdrückt oder bezeichnet, der den Eigennamen enthält, sondern er ist *vorausgesetzt* (Frege 1892: 40). Faktive Nebensätze haben nach Frege dagegen im Allgemeinen eine doppelte Funktion: Zum einen bezeichnen sie den Gedanken, den der Nebensatz sonst (d. h. als selbständiger Aussagesatz) ausdrückt; zum anderen *drücken* sie diesen Gedanken auch selber *aus* (Frege 1892: 47f), ihre Wahrheit wird also nicht vorausgesetzt, sondern behauptet. Vgl. zu interessanten Aspekten und Problemen dieser Auffassung Höhle (in Vorb.)).

<sup>(</sup>iii) a. Karl war erkrankt

<sup>26</sup>Dies wird in einem großen Teil der Literatur übersehen, aber durchaus nicht überall: " Note that in the representation in (7) the focus component of the semantic reading is given as a semantic *relation*, not a single term. This reflects the fact that the focus constituent of a sentence represents novel information not because the constituent itself is necessarily novel, but rather because the semantic relation which the constituent enters into is novel with respect to a given universe of discourse" (Akmajian 1973: 218).

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

c. bei Betonung des Verbs in S*<sup>j</sup>* eine Fokusprojektion von Fk<sup>1</sup> (S*j* ) = Verb zu Fk<sup>2</sup> (S*<sup>j</sup>* ) = Verb + NP*<sup>j</sup>* .

Vergleichen wir zur Illustration (116a,b). Die beiden Sätze unterscheiden sich gemäß (115a) außer durch ihre Betonung dadurch, daß an Stelle der substantivischen NP *den Hund* von (116a) das Personalpronomen *mich* in (116b) steht. Entsprechend (115b) gibt es in (116a) eine Fokusprojektion von Fk<sup>1</sup> (116a) = *den Hund* zu Fk<sup>2</sup> (116a) = *den Hund* + *getreten*.

	- b. Karl hat mich *getreten*
	- c. Karl hat den Hund *getreten*
	- d. Karl hat *mich* getreten

(Nach (105b) muß ein Fk*<sup>n</sup>* in (115b) das Verb enthalten). Entsprechend (115c) gibt es in (116b) eine Fokusprojektion von Fk<sup>1</sup> (116b) = *getreten* zu Fk<sup>2</sup> (116b) = *mich* + *getreten*. Wichtig ist dabei, daß es bei den umgekehrten Betonungsverhältnissen in (116c,d) nach (73) in (116c) keinen Fokus *den Hund* + *getreten* und in (116d) keinen Fokus *mich* + *getreten* gibt. Solange nicht spezielle Zusatzhypothesen aufgestellt werden (für die es keine empirische Motivation gibt), folgt daraus, daß Personalpronomen generell nicht Ausgangspunkt einer Fokusprojektion sein können: Sie sind entweder unbetont; dann können sie nach (66) keinen minimalen Fokus bilden. Oder sie sind betont; dann geht aber eine denkbare Fokusprojektion nach (115c) vom Verb und (nach (73)) nicht von ihnen aus. Natürlich heißt das nicht, daß Personalpronomen nicht im Fokus sein könnten: In (116b) ist das Pronomen Teil von Fk<sup>2</sup> (116b), in (116d) bildet es den einzigen möglichen Fokus.

Dieselben Überlegungen sind auf (117), (118) anzuwenden: In (117a) mit einer substantivischen NP führt die Betonung der NP zu einer Fokusprojektion, in (117b) mit einem Personalpronomen die Betonung des Verbs.

	- b. es heißt, daß er *kommt*
	- b. es heißt, daß *er* kommt

Umgekehrt ist bei der Betonung des Verbs in (118a) bzw. bei Betonung des Personalpronomens in (118b) keine Fokusprojektion möglich.

Es ist häufig (wenn auch undeutlich) bemerkt worden, daß es mit definiten Personalpronomen eine besondere Bewandtnis hat. (Selbst wenn es ein allgemeines Betonungsverbot für Personalpronomen gäbe – was es nicht gibt, cf. (116d),

(118b) –, würde (115c) daraus nicht folgen; man beachte, daß (116c) zwar keinen Fokus *den Hund* + *getreten*, wohl aber Fk<sup>2</sup> (116c) = *Karl* + *getreten* hat). Die Besonderheiten werden oft damit in Zusammenhang gebracht, daß Personalpronomen per Definition 'bekannte Information' darstellten oder allgemein 'anaphorisch' seien. 'Bekannte Information' stellen definite Personalpronomen aber nur in demselben Sinne dar wie viele definite Nominalphrasen ganz allgemein; für diese gilt (115c) jedoch nicht. 'Anaphorisch' sind Personalpronomen nicht ohne weiteres: Die Personalpronomen der ersten und zweiten Person sind per Definition nie anaphorisch (verhalten sich aber gemäß (115c)), und die der dritten Person sind es nicht unbedingt: Man kann, unter geeigneten Umständen, ohne weiteres ein Pronomen der 3. Person verwenden, ohne daß irgendein sprachlicher Kontext gegeben ist. Obendrein verhalten sich echt anaphorische NPs offenbar nicht allgemein wie Personalpronomen. Im übrigen gilt (115c) auch für indefinite Pronomen wie *jemand*, die in keinem Sinne des Wortes 'bekannte Information' darstellen oder anaphorisch sind.

Um zu prüfen, wie sich echt anaphorische Nominalphrasen verhalten, betrachten wir noch einmal das Beispiel (9). Wir haben in 1.2 festgestellt, daß man, soweit keine zusätzliche Information gegeben ist, nur (9b) und nicht

	- b. er will das Auto seinem *Freund* schenken
	- c. Karl hat gestern einen *Porsche* gekauft

(9a) als möglichen Nachfolgersatz zu (9c) ansehen wird. Woran liegt das? Offenbar versteht man (mangels zusätzlicher Information) *das Auto* als Anapher zu *Porsche*. Ist es also so, daß sich Anaphern ähnlich wie Pronomen verhalten, indem sie bei Betonung keine Fokusprojektion zu einem Fokus auslösen, der das Verb umfaßt (denn das Verb muß im Nachfolgersatz zu (9c) offenbar im Fokus sein)? Betrachten wir zum Vergleich die Satzfolge in (119). In diesem Kontext scheint mir die Betonung von *Auto*

	- b. erst *neulich* hat er sich einen *Porsche* gekauft, und weißt du, was er *jetzt* vorhat?
	- c. er will seinem Freund das *Auto* schenken und sich per Schiff auf eine *Welt*reise begeben

in (119c) völlig einwandfrei zu sein, obwohl es nach wie vor eine Anapher von *Porsche* in (119b) ist. Ähnlich in (120). Aus dem Kontext ist klar, daß *das Auto* + *verkaufen* als Fokus von (120d)

3 Explikationen für "normale Betonung" und "normale Wortstellung"

### (120) a. Karl geht es prächtig


intendiert ist, und dies, obwohl *Auto* Anapher von *Porsche* in (120b) und betont ist.

Wenn diese Beobachtungen zutreffen, bietet sich eine Erklärung für die Verhältnisse in (9) mit Hilfe Gricescher Konversationsmaximen an. In (119c) wie in (120d) ist *Auto* aufgrund des RK notwendig Teil des Fokus und kann deshalb in dieser Konfiguration betont auftreten. In (9) dagegen würde es gegen die Maxime der Quantität verstoßen, wenn *Auto* zum Fokus gehören würde: In der Abfolge (9c) vor (9b) wie (9c) vor (9a) ist es aus RK bekannt, daß zwischen Karl und dem Auto eine gewisse Relation besteht. Als neue Information kommt nur in Frage, daß diese Relation ein Vorgang des Schenkens mit Karls Freund als Empfänger ist; daher darf, bei Wahrung konversationeller Maximen, nur *seinem Freund* + *schenken* zum Fokus gehören. Dies ist in (9a) nicht möglich, wohl aber in (9b).

Wenn diese Deutung richtig ist, können wir feststellen: Für die Fokusmöglichkeiten von Personalpronomen gilt eine besondere Regel (115), die von der Regel für nicht-pronominale NPs abweicht. Für definite NPs gibt es im Allgemeinen keine besonderen Beschränkungen hinsichtlich der Verteilung auf Topik und Fokus; die Verteilung von anaphorischen (definiten) NPs folgt allgemeinen konversationellen Maximen. Wie steht es mit indefiniten NPs?

Im Gegensatz zu definiten NPs dienen indefinite NPs nach gängiger Vorstellung typischerweise dazu, bis dahin unbekannte Referenten in den Diskurs einzuführen; auf einen so eingeführten Referenten kann man sich im nachfolgenden Diskurs nicht erneut mit einer indefiniten NP beziehen. Man könnte meinen, daß aus der Bestimmung von 'Fokus' in (32) und (37) folgt, daß NPs mit dieser Funktion nur Teil des Fokus, nicht Teil des Topiks sein können. Dies ist jedoch nicht so. (Daß indefinite NPs nicht notwendig im Fokus sind, hat m. W. erstmals Heidolph (1970: 82) betont.) Dazu zwei Beispiele.

	- b. Karl soll ein *Kind* erschlagen haben
	- c. B: *gehört* habe ich das *auch*, aber es *stimmt* nicht
	- d. Karl hat ein Kind über*fahren*, und zwar *ohne* eigene *Schuld*

Bei Äußerung von (121d) ist aus dem RK bekannt, daß es einen Vorgang gegeben hat, an dem Karl und ein Kind beteiligt waren, *ein Kind* ist also Teil des Topiks. Bei Äußerung von (122c) ist aus RK

	- b. B: das ist eine Verwechslung
	- c. *Heinz* hat eine Amerikanerin geheiratet

bekannt, daß jemand eine Amerikanerin geheiratet hat; *eine Amerikanerin* kann deshalb in (122c) nicht im Fokus sein. Gleichwohl kann man den Dialog (121a–d) durch (121e) fortsetzen, wo die definite NP *das Kind* darauf hinweist, daß durch *ein Kind* in (121d) ein Referent festgelegt worden ist; entsprechend kann (122d) auf (122c) folgen, wo das anaphorische *sie* klar macht, daß durch *eine Amerikanerin* in (122c) ein Referent eingeführt worden ist. In beiden Fällen akzeptiert der Sprecher B bei Äußerung von (121d) bzw. (122c) die in RK enthaltene Charakterisierung für 'ein Kind'


bzw. 'eine Amerikanerin' nicht als ausreichend, um einen bestimmten Referenten festzulegen; er betrachtet diese NPs als 'nicht-spezifisch'. Durch die Äußerung von (121d) bzw. (122c) wird jedoch, jedenfalls für die Zwecke von B, der Referent eindeutig bestimmt als das Kind, das Karl überfahren hat bzw. als die Amerikanerin, die Heinz geheiratet hat. Man sieht daraus, daß nicht die indefinite NP selbst einen Referenten einführt (dann könnte sie in (121d) und (122c) tatsächlich nach (32) und (37) nur zum Fokus gehören), sondern der ganze Satz dient – unter geeigneten Umständen – dazu, einen Referenten für die NP zu etablieren. Daher ist es nicht überraschend, daß indefinite NPs im Topik vorkommen und dennoch zur Festlegung eines neuen Referenten beitragen können.

### **1.4.4 Explanatorische Fruchtbarkeit**

Die in (79) formulierte Explikation von 'stilistisch normaler Betonung' ist nicht nur heuristisch fruchtbar, sondern sie hat Erklärungswert. Dies halte ich für das wichtigste an dem ganzen Ansatz: Sie macht verständlich, *warum* ein gegebener Satz als stilistisch normal bzw. nicht-normal betont empfunden wird, und in ihrem Licht sieht man, was an den in 1.2 besprochenen Explikationsversuchen richtig ist und wo ihre Fehler liegen.

Alle Versuche, die auf 'Kontextungebundenheit' von Normalbetonung abheben ((7), (8), (10), (11)), sind insofern korrekt, als normal betonte Sätze in mehr

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

Kontexttypen auftreten können als entsprechende nicht-normal betonte Sätze; das heißt nicht – und da liegt der Fehler dieser Versuche –, daß sie in beliebigen Kontexttypen auftreten könnten oder auch nur in allen Kontexttypen, in denen dieselbe Wortfolge mit anderem Betonungsmuster möglich ist. Im Gegenteil: Normalbetonte Sätze können in den meisten Fällen gerade nicht in denselben Kontexten wie die entsprechenden nicht-normal betonten auftreten; in dem Kontexttyp z. B., der für (123a) natürlich ist, ist (123b) trotz Normalbetonung unmöglich:

	- b. Karl hat den *Hund* getreten

Auch die Explikation (13), die auf 'Hervorhebung' bei nicht-normaler Betonung abhebt, ist partiell korrekt: Bei normaler Betonung ist die betonte Konstituente im Allgemeinen nicht der einzige mögliche Fokus des Satzes, so daß kein Fokus besonders ausgezeichnet ist; viele Fälle von nicht-normaler Betonung dagegen sind nicht-fokusprojektiv, so daß nur die betonte(n) Konstituente(n) im Fokus und insofern besonders 'hervorgehoben' ist/sind; cf. besonders (80). In einem gegebenen Kontext jedoch kann auch bei Normalbetonung der Fokus minimal und damit 'hervorgehoben' sein.

Im typischen Fall kann bei einem normalbetonten Satz S*<sup>i</sup>* der ganze Satz im Fokus sein; das Topik ist dann leer, und kein Teil der LC von S*<sup>i</sup>* ist in RK enthalten. Natürlicherweise sind solche Sätze für Text- oder Diskursanfänge entsprechend (10), (11) besonders geeignet, während innerhalb eines fortlaufenden Textes/Diskurses gemäß konversationellen Maximen ein Nachfolgersatz gewöhnlich auf den RK Bezug nehmen muß; daher sind Äußerungen von normalbetonten Sätzen mit maximalem Fokus dort seltener zu finden.

Es ist zu erwarten, daß solche Sätze, wenn sie ohne jeden Kontext präsentiert werden, eher als 'normal' empfunden werden als solche, die notwendig ein Topik und damit implizit den Bezug auf einen RK enthalten.<sup>27</sup> Auf diese Weise kommen Stockwells 'citation patterns' zustande. Die Abwesenheit von 'additional components or differential meaning' resultiert daraus, daß dem Fokus von S*<sup>i</sup>* kein Topik gegenüber steht, wenn Fk (S*<sup>i</sup>* ) = MK (S*<sup>i</sup>* ).

Auch die Tatsache, daß Kiparsky und Bierwisch für 'Normalbetonung' genau 1 Hauptakzent annehmen, so daß Fälle mit mehr voll betonten Konstituenten

<sup>27</sup>Wir haben erwähnt, daß außer Topik/Fokus u. a. auch die Identifizierbarkeit der Referenten von NPs für die Verwendbarkeit eines Satzes in gegebenem Kontext eine Rolle spielt, vgl. Fn. 25. Daher ist z. B. (i) von Fn. 2 nur unter besonders engen Voraussetzungen als 'Textanfang' möglich (was auch immer man unter 'Text' versteht).

in (15) als 'kontrastiv' ausgezeichnet werden, wird begreifbar: Im typischen Fall haben Sätze mit *n* betonten Konstituenten weniger Fokusmöglichkeiten als vergleichbare Sätze mit *m* betonten Konstituenten, wenn *n > m*; cf. z. B. (48) vs. (57), (106), (109).

Da die Explikation von 'Normalbetonung' in eine pragmatische Kontexttheorie eingebettet ist, erlaubt sie die Klärung eines bekannten Problems: Wieso wird in (65) *insult* als Anapher von *call s.o. a Republican* verstanden, und wieso kann dort *he* eine Anapher von *Bill* und *him* eine Anapher von *John* sein, aber nicht umgekehrt?<sup>28</sup>

(65) John called Bill a Republican, and then *he* insulted *him*

Wir beobachten zunächst, daß im zweiten Konjunkt von (124a) *der Kunde* + *wurde* + *unverschämt* ein möglicher und in diesem Kontext naheliegender Fokus ist. In (124b) dagegen kann nur *der Kunde* Fokus sein; *wurde* + *unverschämt* ist Topik. Damit muß aus dem RK

	- b. der Lehrling hat den *Meister* beschimpft, und dann wurde der *Kunde* unverschämt

bekannt sein, daß jemand unverschämt wurde. In diesem Kontext ist der Zusammenhang klar: Den Meister zu beschimpfen kann als eine Form des Unverschämtseins betrachtet werden. Daher wirkt (125a) redundant, wenn mit *er* der Lehrling gemeint ist. Dieser Eindruck verstärkt sich

	- b. der Lehrling hat den *Meister* beschimpft, und dann wurde *er* unverschämt

in (125b): Hier kann nur *er* einziger Fokus sein; daß jemand unverschämt war, muß aus RK bekannt sein. Aus dem ersten Konjunkt ist bekannt, daß der Lehrling unverschämt war (indem er den Meister beschimpfte); deshalb kann es keine neue Information sein, daß er, der Lehrling, unverschämt wurde. Mit *er* kann hier nur eine dritte Person gemeint sein (was ohne weiteren Kontext nicht nahe liegt) oder der Meister. Dies ist die intuitiv nahe liegende Interpretation; sie folgt aus den Fokusverhältnissen.

<sup>28</sup>Für frühere Diskussionen zu diesen Fragen vgl. u. a. Lakoff (1971), Schmerling (1976: 63-75), Kempson (1975: §8.6.1.) und besonders Prince (1981: § 2.1.).

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

Wir halten fest: Ein unbetontes Prädikat wird, da es in diesen Fällen Topik ist, im Allgemeinen als Anapher eines vorhergehenden Prädikats interpretiert; ein betontes Personalpronomen kann in solchen Fällen natürlicherweise nicht eine Anapher des vorhergehenden Subjekts sein. Völlig deutlich wird dies in (126b). Wenn *er* in (126a) eine

	- b. der Lehrling hat den *Meister* geschlagen, und dann hat *er* den Meister geschlagen

Anapher von *Lehrling* sein soll, ist das zweite Konjunkt eine Wiederholung des ersten (und deshalb konversationell aberrant, weil nach *dann* keine Wiederholung erwartet wird). Wenn dasselbe für (126b) gelten sollte, wäre darüber hinaus die Tatsache, daß es der Lehrling war, der den Meister geschlagen hat, als neue zusätzliche Information ausgezeichnet, was absurd wäre: Hier muß *er* eine dritte Person bezeichnen.

Dabei kommt es natürlich nicht wesentlich darauf an, daß ein betontes *er* keine Anapher des syntaktischen Subjekts im ersten Konjunkt sein kann; aufgrund der Definition von semantischem Fokus geht es vielmehr um die Relationen in der logischen Charakterisierung der Sätze. Daher finden wir den oberflächlich umgekehrten Fall, wenn das zweite Konjunkt passiviert ist. Im zweiten Konjunkt von (126c) ist *beschimpft* <sup>+</sup> *worden* Topik, d. h. daß ein Äquivalent von " jemand hat jemand beschimpft"

(126) c. der Lehrling hat den *Meister* beschimpft, und dann ist *er* beschimpft worden

in RK ist. Wollte man *er* auf *Meister* beziehen, wäre als neue Information gekennzeichnet, daß er, der Meister, es war, der beschimpft wurde – aber das ist aus dem ersten Konjunkt schon bekannt. Daher kann hier mit *er* nur der Lehrling oder eine dritte Person gemeint sein.

Bei zweistelligen Verben sind außerdem die Objektpronomen zu beachten. In (127a) kann nur *er* den einzigen Fokus bilden; genau parallel zu (126b) muß aus RK bekannt sein, daß jemand den Referenten von *ihn* gepeitscht hat; *ihn* ist also Anapher von *Meister*, und *er*

	- b. der Lehrling hat den *Meister* gepeitscht, und dann hat er *ihn* gepeitscht


kann aus den oben besprochenen Gründen nicht Anapher von *Lehrling* sein. In (127b) ist *ihn* einziger möglicher Fokus, und aus RK muß bekannt sein, daß der Referent von *er* jemand gepeitscht hat. Mit *er* kann hier deshalb nur der Lehrling gemeint sein; *ihn* muß eine dritte Person bezeichnen. (127c) ist genau entsprechend. Danach ist es klar, daß in (127d), wo *er* + *ihn* den Fokus bildet, *er* keine Anapher von *Lehrling* und *ihn* keine Anapher von *Meister* sein kann, denn sonst entspräche der Fokus einem Teil des RK. Beide Pronomen können hier Personen bezeichnen, die im ersten Konjunkt nicht genannt sind; oder aber*ihn* ist Anapher von *Lehrling* und/oder *er* ist Anapher von *Meister*. Dies sind genau die intuitiv möglichen Interpretationen von (127d). Entsprechend sind die Bezugsmöglichkeiten der Pronomen in (127e,f).

Genauso wie in (127d) sind die Antezedensmöglichkeiten der Pronomen in (128a), einer Parallele zu (65). Zu klären bleibt hier

	- b. der Lehrling hat den *Meister* gepeitscht, und dann hat der *Kunde* den *Chef* liebkost
	- c. der Lehrling hat den *Meister* gepeitscht, und dann hat der *Kunde* den Meister liebkost

nur die Interpretation des Verbs. Die Lage ist hier ähnlich wie in (124b) und (125b): Das Verb *liebkost* muß aufgrund der Betonungsverhältnisse Topik sein, also muß im RK sein, daß jemand jemanden liebkoste. Davon ist im ersten Konjunkt jedoch nicht ausdrücklich die Rede, und wir wollen annehmen, daß dies auch für den weiteren Kontext gilt. Ganz entsprechend ist es in (128b). In (128c) ist es insofern anders, als das Topik auch *den Meister* enthält; aus RK muß hier also bekannt sein, daß jemand den Meister liebkoste. Aus dem ersten Konjunkt ist bekannt, daß jemand den Meister peitschte; um ein dem Kontext angemessenes Verständnis zu erlangen, muß der Hörer deshalb annehmen, daß Peitschen eine Form der Liebkosung ist. Zieht der Hörer diesen Schluß nicht – und es gibt nichts, was

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

ihn dazu zwingen könnte; je nach seinen eigenen Ansichten und seinen Vermutungen über Gegebenheiten in der Welt mag er diesen Schluß als vollkommen ausgeschlossen oder aber (z. B. wenn er weiß, daß der Meister Masochist ist) als naheliegend betrachten –, dann muß er (128c) für inkohärent halten. Zieht er diesen Schluß jedoch und interpretiert *liebkost* als Anapher von *gepeitscht*, dann ist (128c) – und in gleicher Weise (128a,b) – völlig einwandfrei.

Die durch (65) bzw. (128a) präsentierten Probleme lösen sich also ohne irgendwelche Zusatzannahmen als natürliche Konsequenz der in (37) formulierten Kontexttheorie und der darauf basierenden Theorie der Betonung (66).

Bei der Analyse von (127) und (128) haben wir einen erklärenden Gebrauch von der Explikation von stilistisch normaler Betonung gemacht, indem wir sie auf Fälle von nicht-normal betonten Sätzen angewendet haben. Worin liegt nun der erklärende Charakter der Explikation, wenn man sie auf normal betonte Sätze anwendet?

Ein Satz mit normaler Betonung ist unter allen Sätzen mit gleicher Wortfolge kontextuell am wenigsten restringiert. Daher kann man ihn in den relativ meisten verschiedenen Situationstypen verwenden, man kann die meisten 'verschiedenen Sprechhandlungen' damit vollziehen. Mit einem normalbetonten Fragesatz wie (129a) z. B. kann man, nach einer geläufigen Ausdrucksweise, 'verschiedene' Fragen stellen: ob es der Hund war, den Karl

	- b. hat *Karl* den Hund geschlagen?

geschlagen hat; ob Karls Tätigkeit darin bestand, den Hund zu schlagen; ob das Geschehen darin bestand, daß Karl den Hund geschlagen hat. Mit dem nicht-normal betonten Fragesatz (129b) dagegen kann man nur fragen, ob Karl es war, der den Hund geschlagen hat. Entsprechend für andere Satzarten. Allerdings kann man den Bezug auf 'verschiedene mögliche Sprechhandlungen', so verlockend es ist, nicht anstelle des Bezugs auf mögliche Kontexttypen zur Grundlage der Explikation machen, da Ausdrücke wie " verschiedene Sprechhandlungen/Fragen/ Aussagen" usw. in der hier gemeinten Interpretation selbst nur unter Rekurs auf mögliche Kontexttypen expliziert werden können. Die 'verschiedenen' Fragen, die man mit (129a) stellen kann, sind ja nicht etwa logisch verschieden.

Es scheint mir nun sehr natürlich zu sein, daß man ein Instrument, das (relativ) vielen verschiedenen Zwecken dienen kann, als 'normal' bezeichnet, während man ein vergleichbares Instrument, das für relativ wenige Zwecke taugt, als 'speziell' oder 'nicht-normal' bezeichnet. Insofern meine ich, daß unter der in 1.3.3 entwickelten Explikation, die essentiell pragmatischer Natur ist, da sie

auf mögliche Kontexttypen von Sätzen abstellt, erstmals inhaltlich verständlich wird, in welchem Sinne die Normalbetonung 'normal' ist; (79) sagt nicht nur, *daß* normalbetonte Sätze gewisse Eigenschaften haben, sondern zeigt auch, *warum* Sätze mit solchen Eigenschaften als 'normal' gelten.

### **2 Stilistisch normale Wortstellung**

### **2.1 Einige Fakten**

Wir haben früher gesehen, daß Sätze wie (130a,b) die Foki (131) bzw. (132) haben können:

	- b. Karl hat das Buch dem *Kind* geschenkt
	- b. Fk<sup>2</sup> (130a) = das Buch + geschenkt
	- c. Fk<sup>3</sup> (130a) = Karl + das Buch + geschenkt
	- d. Fk<sup>4</sup> (130a) = dem Kind + das Buch + geschenkt
	- e. Fk<sup>5</sup> (130a) = MK (130a) = Karl + dem Kind + das Buch + geschenkt
	- b. Fk<sup>2</sup> (130b) = dem Kind + geschenkt
	- c. Fk<sup>3</sup> (130b) = Karl + dem Kind + geschenkt
	- d. Fk<sup>4</sup> (130b) = das Buch + dem Kind + geschenkt
	- e. Fk<sup>5</sup> (130b) = MK (130b) = Karl + das Buch + dem Kind + geschenkt

Vergleichen wir damit die Sätze (133a,b) und prüfen wir, zu welchen Fragen in (134) sie passen. (133a) paßt zu den Fragen (134a,c,e); aber nicht zu (134b,d,f,g). Die Foki von (133a) sind daher die in (135) angegebenen. Zu (133b) passen die

	- b. das Buch hat Karl dem *Kind* geschenkt
	- b. wem hat Karl das Buch geschenkt?
	- c. was hat Karl hinsichtlich des Kindes getan?
	- d. was hat Karl mit dem Buch gemacht?
	- e. was hat das Kind erlebt?

3 Explikationen für "normale Betonung" und "normale Wortstellung"


Fragen (134b,d,f); aber nicht (134a,c,e,g). Daher die in (136) genannten Foki.

	- b. Fk<sup>2</sup> (133a) = das Buch + geschenkt (= Fk<sup>2</sup> (130a))
	- c. Fk<sup>3</sup> (133a) = Karl + das Buch+ geschenkt (= Fk<sup>3</sup> (130a))
	- b. Fk<sup>2</sup> (133b) = dem Kind+ geschenkt (= Fk<sup>2</sup> (130b))
	- c. Fk<sup>3</sup> (133b) = Karl + dem Kind + geschenkt (= Fk<sup>3</sup> (130b))

Es fällt ins Auge, daß MF (133a) *⊂* MF (130a) und MF (133b) *⊂* MF (130b).

Vergleichen wir auch (137a,b) mit (138a,b). (137a) hat die in (139) genannten Foki, (137b) die in (140) genannten. (138a)

	- b. Fk<sup>2</sup> (137a) = dem Kind + geschenkt
	- c. Fk<sup>3</sup> (137a) = Karl + dem Kind + geschenkt
	- d. Fk<sup>4</sup> (137a) = ihn + dem Kind + geschenkt
	- e. Fk<sup>5</sup> (137a) = MK (137a) = Karl + ihn + dem Kind + geschenkt

$$\text{(140)}\qquad \text{a. } \text{Fk}\_1 \text{ (137b)} \text{ = das Buch.}$$

	- b. Fk<sup>2</sup> (138a) = dem Kind + geschenkt (= Fk<sup>2</sup> (137a))
	- c. Fk<sup>3</sup> (138a) = Karl + dem Kind + geschenkt (= Fk<sup>3</sup> (137a))
	- b. Fk<sup>2</sup> (138b) = das Buch + geschenkt (= Fk<sup>2</sup> (137b))
	- c. Fk<sup>3</sup> (138b) = Karl + das Buch + geschenkt (= Fk<sup>3</sup> (137b))

hat dagegen nur die Foki von (141) und (138b) hat die von (142). Wieder ist MF (137a) *̸*= MF (138a) und MF (137b) *̸*= MF (138b), und zwar derart, daß MF (138a) *⊂* MF (137a) und MF (138b) *⊂* MF (137b).

Woran liegt es nun, daß die Mengen der Foki in (133) und (138) eingeschränkt sind, so daß diese Sätze relativ zu den verglichenen Sätzen in (130) und (137) kontextuell stärker restringiert sind? In 1.3.2 haben wir ähnliche Einschränkungen bei der Menge der Foki in Abhängigkeit von der Betonung beobachtet. An der Betonung kann es jedoch nicht liegen, daß (133) und (138) in weniger Kontexttypen vorkommen als (130) und (137): Man überzeugt sich leicht davon, daß (133) und (138) unter einer anderen Betonung nicht mehr Foki haben können, allenfalls weniger. Dementsprechend sind (133a,b) und (138a,b) nach (78) hinsichtlich der Betonung kontextuell relativ unmarkiert; sie sind nach (79) – in Übereinstimmung mit der Intuition – stilistisch normal betont.

Zugleich scheint es intuitiv – bei (133) vielleicht deutlicher als bei (138) – , daß die Wortstellung in diesen Sätzen stilistisch weniger normal ist als in den Sätzen von (130) und (137), und offensichtlich hängt damit die Einschränkung der Fokusmöglichkeiten zusammen. Allerdings kann man 'stilistisch normale Wortstellung' natürlich nicht unmittelbar als Definiens bei der Beschreibung von Fällen wie (133), (138) benutzen: Dieser Ausdruck bedarf vielmehr selbst der Explikation, und zwar mit Hilfe empirisch kontrollierbarer Phänomene wie dem Vergleich zwischen (130) und (133) bzw. (137) und (138).

### **2.2 Explikation von** " **stilistisch normale Wortstellung**"

(143) *Hypothese:*

Wenn zwei Sätze S*<sup>i</sup>* , S*<sup>j</sup>* in ES*<sup>i</sup>* (vgl. (76b)) sind, gilt: MF (S*<sup>i</sup>* ) *⊆* MF (S*<sup>j</sup>* ) oder MF (S*<sup>j</sup>* ) *⊆* MF (S*<sup>i</sup>* ).

Diese Hypothese stützt sich auf viele Beobachtungen; man beachte aber, daß sie keineswegs trivial ist: Es wäre ohne weiteres denkbar, daß die Regeln zur Fokusprojektion je nach Wortstellung verschiedene nicht-minimale Foki zulassen, so daß MF (S*<sup>i</sup>* ) *∩* MF (S*<sup>j</sup>* ) *̸*= MF (S*<sup>j</sup>* ) und *̸*= MF (S*<sup>i</sup>* ) wäre. Das scheint nicht der Fall zu sein.

In (78) haben wir, unter Bezug auf Sätze mit gegebener Wortstellung, den Begriff 'kontextuell relativ unmarkiert (hinsichtlich der Betonung)' definiert. Parallel dazu (144):

(144) *Definition:*

Unter allen Sätzen in ES*<sup>i</sup>* sind die S*<sup>i</sup> j* hinsichtlich. der Wortstellung kontextuell relativ unmarkiert, die in der größten Zahl von Kontexttypen vorkommen können. Alle anderen Sätze S*ik* in ES*<sup>i</sup>* sind hinsichtlich der Wortstellung kontextuell markiert.

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

Aus (143) folgt, daß für die S*ik* von (144) gilt: MF (S*ik* ) *⊂* MF (S*<sup>i</sup> j* ).

Nach (144) sind (133a,b) und (138a,b) hinsichtlich der Wortstellung kontextuell markiert, während (130a,b) und (137a,b) hinsichtlich der Wortstellung kontextuell relativ unmarkiert sind. Man könnte versuchen, dies unmittelbar für die Explikation von 'normaler Wortstellung' zu nutzen; aus intuitiven und systematischen Gründen sollte aus einer adäquaten Explikation aber auch folgen, daß z. B. (145a) 'normale' Wortstellung aufweist und (145b) 'nichtnormale'; diese Sätze sind aber nach (144) hinsichtlich der Wortstellung beide kontextuell markiert, da MF (145a) = MF (145b) = *dem Kind* und da es eine alternative Konstituentenfolge mit einer größeren Menge von Foki gibt, nämlich (130b). Ebenso sind (146a,b) in gleicher Weise hinsichtlich der Wortstellung kontextuell


relativ unmarkiert, da MF (146a) = MF (146b) und da bei gleicher Konstituentenbetonung bei keiner anderen Konstituentenfolge mehr Foki als in (146a,b) möglich sind; trotzdem möchte man die Wortstellung in (146a) als 'normal' bezeichnen und die in (146b) nicht.

Eine Definition, die wie (144) auf Mengen von Sätzen mit einer gegebenen Konstituentenbetonung rekurriert, ist also offenbar für die Explikation des Begriffs 'stilistisch normale Wortstellung' nicht geeignet. Vielmehr scheint es so zu sein, daß Konstituentenfolgen wie in (145a), (146a) unter *jeder* Konstituentenbetonung 'normal' sind; d. h. alle Sätze in der EB*<sup>i</sup>* (vgl. (76a)), zu der (145a) gehört, weisen 'normale' Wortstellung auf. Entsprechend weisen alle Sätze in den EB*<sup>i</sup>* , zu denen (145b) bzw. (146b) gehören, 'nicht-normale' Wortstellung auf. Daß die Wortstellung von (145b) und (146b) als nicht-normal empfunden wird, hängt, wie wir bei der Besprechung von (133a,b) gesehen haben, offenbar damit zusammen, daß es bei diesen Konstituentenfolgen unter keiner wie immer gearteten Konstituentenbetonung eine Fokusprojektion zur Menge der Konstituenten des Satzes gibt, während eine solche Fokusprojektion bei der Konstituentenfolge von (145a) unter einer geeigneten Konstituentenbetonung (nämlich wie in (130a)) möglich ist. Da die Zahl der prinzipiell möglichen Foki also – unabhängig von der gewählten Konstituentenbetonung – bei Konstituentenfolgen wie in (145b) und (146b) gegenüber solchen wie in (145a) grundsätzlich eingeschränkt ist, soll die gesuchte Explikation die Wortstellung als normal auszeichnen, die bei geeigneter Betonung mit den wenigstens kontextuellen Restriktionen verbunden ist.

Ich schlage daher die folgende Formulierung vor:

(147) Unter allen Sätzen in EBS*<sup>i</sup>* (vgl. (76c)) haben die Sätze S*<sup>i</sup> j stilistisch normale Wortstellung*, für die gilt: In EB*<sup>i</sup>* , S*<sup>i</sup> j* in EB*<sup>i</sup>* , ist ein Satz S*ik* , der unter allen Sätzen in EBS*<sup>i</sup>* in den meisten Kontexttypen vorkommen kann.

Erläuterung: In wievielen Kontexttypen ein Satz vorkommen kann, hängt davon ab, wieviele Foki er hat. Ein Satz hat, bei gegebener Wortstellung (d. h. in EB*<sup>i</sup>* ), normale Betonung, wenn er unter allen Sätzen in EB*<sup>i</sup>* die meisten Foki hat. Um zu prüfen, ob ein Satz S*<sup>i</sup>* normale Wortstellung hat, muß man also feststellen: (1) welche S*<sup>j</sup>* in der EB*<sup>i</sup>* , zu der S*<sup>i</sup>* gehört, normalbetont sind, (2) ob eine andere Konstituentenfolge unter Normalbetonung mehr mögliche Foki als S*<sup>j</sup>* zuläßt. Ist dies nicht der Fall, hat S*<sup>i</sup>* nach (147) eine stilistisch normale Wortstellung.

Man überzeugt sich leicht davon, daß diese Explikation für die diskutierten Beispiele das gewünschte Ergebnis liefert; vgl. die Diskussion von (130a) im Vergleich zu (133a,b) und (137) im Vergleich zu (138).

Besonders interessant sind solche EBS*<sup>j</sup>* für die (148) gilt:

(148) EBS*<sup>i</sup>* enthält mindestens einen Satz S<sup>m</sup> derart, daß Fk<sup>1</sup> (Sm) genau 1 Konstituente umfaßt und Fk<sup>m</sup> (Sm) = MK (Sm).

Die S<sup>m</sup> von (148) zeichnen sich also dadurch aus, daß sie (soweit sie aus mehr als 1 Wort bestehen) eine Fokusprojektion vom kleinsten theoretisch möglichen Fokus, nämlich 1 Wort, zum größten theoretisch möglichen Fokus, nämlich MK (S), haben. Im typischen Fall hat eine EBS*<sup>i</sup>* genau einen solchen Sm. Manche haben jedoch mehrere: (130a) und (130b) sind Elemente derselben EBS*<sup>i</sup>* und sind beide ein Sm; und nicht alle EBS*<sup>i</sup>* haben einen Sm: Offenbar aufgrund pragmatischer Gebrauchsrestriktionen haben Sätze mit einer Negation anscheinend nie die Menge aller Konstituenten als möglichen Fokus (d. h. eine 'Satznegation' in einem pragmatischen Sinne gibt es nicht, cf. Givón (1978)); mindestens bei einigen Typen von Wortfragen (aber nicht bei Satzfragen) und von Exklamativsätzen scheint die Projektion zu MK (S) ausgeschlossen; Gradpartikeln verhindern offenbar jede Fokusprojektion von dem Fk*<sup>i</sup>* (S*i* ) = K*<sup>i</sup>* , dem sie zugeordnet sind, zu einem Fk*i*+1 (S*<sup>i</sup>* ) = K*<sup>i</sup>* + K*<sup>j</sup>* , und da sie nie den ganzen Satz als zugeordneten Fokus haben, können sie in keinem S<sup>m</sup> vorkommen.

Es scheint eine empirische Tatsache zu sein, daß die Anzahl der Foki jedes S<sup>m</sup> maximal ist:

(149) *Hypothese:*

Es gibt keinen S*<sup>i</sup>* in EBS*<sup>i</sup>* , der mehr mögliche Foki als S<sup>m</sup> hat.

Für Sätze in einer ES*<sup>i</sup>* folgt (149) aus (143). Für Sätze mit verschiedenen Konstituentenbetonungen folgt (149) (ebenso wie (143)) vermutlich aus allgemeinen Eigenschaften der Fokusprojektionsregeln; darüber will ich hier nicht spekulieren. 3 Explikationen für "normale Betonung" und "normale Wortstellung"

Wegen (149) kann S<sup>m</sup> in maximal vielen Kontexttypen vorkommen; dies wollen wir terminologisch hervorheben:

(150) Jeder S<sup>m</sup> in EBS*<sup>i</sup>* ist *kontextuell absolut unmarkiert*.

Aus unseren Definitionen folgt:

	- b. Jeder S<sup>m</sup> weist normale Wortstellung und Normalbetonung auf.
	- c. Alle S*<sup>i</sup>* in EBS*<sup>i</sup>* , die in derselben EB*<sup>i</sup>* wie ein S<sup>m</sup> von EBS*<sup>i</sup>* sind, weisen normale Wortstellung auf.

### **2.3 Fruchtbarkeit der Explikation**

### **2.3.1 Adäquatheit**

Es scheint mir deutlich zu sein, daß die – essentiell pragmatischen – Formulierungen (147) und (151) eine adäquate Explikation des traditionellen intuitiven Begriffs " normale Wortstellung" angeben (soweit er konsistent gebraucht wird). Sie steht in Übereinstimmung mit den wenigen Explikationsversuchen in der Literatur:

(152) " Wenn man einen Sachverhalt schildert oder erfragt, bei dem keine Einzelheit besonders hervorgehoben wird, stehen die Satzglieder in einer regelmäßigen Ordnung, die wir als 'Grundstellung' der Satzglieder bezeichnen wollen." (Griesbach 1961 (IV): 84)

Es erübrigt sich, auf die Probleme von (152) einzugehen, die u. a. – ähnlich wie bei den Explikationsversuchen für " Normalbetonung" in 1.2 – mit dem Ausdruck " besonders hervorgehoben" zusammenhängen. Es scheint klar, daß bei adäquater Klärung dieser Probleme kein inhaltlicher Unterschied zu (147) besteht. Ähnlich in (153):

(153) " A word order is referred to as basic if it can stand without any presupposition as to what should be considered as being already known." (Kiefer 1970: 140)

Wir brauchen nicht näher darauf einzugehen, inwieweit (153) mit (147) übereinstimmt und wo die Mängel von (153) liegen. Immerhin ist beachtenswert, daß (152) so, wie die Formulierung ist, vermutlich nur für S<sup>m</sup> gedacht ist, während (153) wegen des Modals *can* die Anwendung auf eine ganze EB*<sup>i</sup>* zuläßt, sofern diese einen S<sup>m</sup> enthält.

### **2.3.2 Heuristische Fruchtbarkeit**

Da die Explikation von 'stilistisch normaler Wortstellung' auf dem Fokusbegriff aufbaut und da wir wissen, daß es Regeln für die Bestimmung der möglichen Foki eines Satzes geben muß, provoziert diese Explikation die Frage, welche Faktoren die Fokusprojektion bei nicht-normaler Wortstellung blockieren; sie eröffnet damit ein Forschungsfeld, das – mit der Ausnahme von Contreras (1976) – bisher weitgehend ignoriert worden ist, möglicherweise aber auch für die Kenntnis der Regularitäten bei normaler Wortstellung ergiebig ist.

Betrachten wir, um etwas mehr über nicht-normale Wortstellungen zu erfahren, noch einmal (133) und (138). Ein Teil der Fakten folgt aus der Hypothese (154). Informell umschrieben besagt sie: Wenn

	- b. das Buch hat Karl dem *Kind* geschenkt

Wenn bei zwei Sätzen S*<sup>i</sup>* , S*<sup>j</sup>* die in einer ES*<sup>i</sup>* sind,


in S*<sup>j</sup>* auch nur eine Fokusprojektion von einem Fokus mit *n* Konstituenten zu einem Fokus mit *n* + 1 Konstituenten blockiert ist, die bei anderer Wortstellung (in S*<sup>i</sup>* ) möglich ist, dann ist in S*<sup>j</sup>* jede weitere Fokusprojektion zu einem Fokus mit *n* + 2 Konstituenten ebenfalls blockiert.

Aus (154) folgt, daß (133a,b) im Gegensatz zu (130a,b) keine Fokusprojektion zur Menge der Konstituenten haben, da bereits eine der Fokusprojektionen zu einem Fokus mit geringerem Umfang, wie sie bei (130a,b) möglich ist (vgl. (131d), (132d)), blockiert ist; das gleiche gilt für (138) im Verhältnis zu (137).

Aus (154) geht jedoch nicht hervor; wieso die Sätze (133a,b) nicht die Foki von (131d), (132d) haben bzw. (138a,b) nicht die von (139d), (140d). Eine Vermutung legt sich nahe:

(155) *Hypothese:*

Für Sätze S*<sup>i</sup>* , S*<sup>j</sup>* in EBS*<sup>i</sup>* :

Wenn in S*<sup>i</sup>* bei normaler Wortstellung die Konstituentenfolge K*<sup>j</sup> >* K*<sup>i</sup>* gilt, dann nimmt, wenn K*<sup>i</sup> >* K*<sup>j</sup>* in S*<sup>j</sup>* , K*<sup>i</sup>* in S*<sup>j</sup>* an keiner Fokusprojektion teil.

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

Aus (155) folgen nicht nur die Verhältnisse in (133) und (138),<sup>29</sup> sondern auch die in (156a,b), wo *das Buch* bzw. *dem Kind* natürlich minimale Foki sind, aber im Unterschied zu (130) jede Fokusprojektion ausgeschlossen erscheint. Auch für (156c) scheint (155) zuzutreffen, denn im Gegensatz zu (133a) und (57) gibt es hier anscheinend nur Fk<sup>1</sup> (156c) = Fk<sup>m</sup> (156c) = *dem Kind* + *das Buch*. Ebenso bei einstelligen Verben wie in (157): Während in (158) jeweils eine Fokusprojektion zur Menge der Konstituenten möglich ist, ist dies in (157) ausgeschlossen:

	- b. dem *Kind* hat Karl das Buch geschenkt
	- c. dem *Kind* hat Karl das *Buch* geschenkt

	- b. \* weil das Buch Karl dem *Kind* geschenkt hat

Für (155) entsteht daraus kein Problem, da eine EBS*i* , wie ich selbstverständlich vorausgesetzt habe, nur grammatisch wohlgeformte Sätze enthält. Die Unakzeptabilität von (i) und (ii) ist innerhalb der Topologie zu beschreiben und folgt nicht aus pragmatischen Regularitäten.

In dem Maße, wie (155) empirisch korrekt ist, erfaßt die Hypothese – wie übrigens auch (103) – eine wichtige Tatsache: daß bestimmte Wortfolgen – z. B. die in (iii) – im gleichen Maße normal sind, unabhängig davon, ob die erste Konstituente im Vorfeld oder im Mittelfeld steht:

	- b. weil Karl dem Kind das Buch geschenkt hat

Eben diese Tatsache hat so viele Autoren dazu verführt, die Stellung des Subjekts nach dem finiten Verb wie in (133) auf eine 'Inversion' des Subjekts aus dem Vorfeld ins Mittelfeld zurückzuführen. Tatsächlich ist " Mittelfeld" ein essentieller Begriff der deutschen Topologie jedoch gerade deshalb, weil die z. B. für (iv) relevanten Stellungsregularitäten mittels 'Subjektinversion' und ohne Benutzung eines Konstrukts wie 'Mittelfeld' überhaupt nicht formulierbar wären.

	- b. weil ihr das Buch seinerzeit ein Priester geschenkt hat

(Aber wenn 'Mittelfeld' als Domäne von Stellungsregeln gegeben ist, ist 'Subjektinversion' ein nutzloses Konstrukt.) Vgl. dazu sehr klar Griesbach (1960 (I): 105). (Inhaltlich nicht anders schon bei Erdmann (1886: 182f, 189, 196).)

<sup>29</sup>Die Formulierung von (155) unterscheidet nicht, ob eine der relevanten Konstituenten im Vorfeld oder im Mittelfeld steht. Das bedeutet natürlich nicht, daß es keine grammatisch relevanten Unterschiede zwischen den Wortstellungsregeln fürs Mittelfeld und den Regeln für die Besetzung des Vorfelds gibt. Im Gegenteil: Die Wortfolge von (138a) ist bei gleicher Konstituentenbetonung unmöglich, wenn die erste NP im Vorfeld steht, vgl. (i); und bei gleicher Konstituentenbetonung ist die Wortfolge von (133) innerhalb des Mittelfelds ausgeschlossen, vgl. (ii):

	- b. angekommen ist dein *Vater*

Gar nichts trägt (155) jedoch zum Verständnis von Fällen wie (159) bei. Im Widerspruch zu (155) hat (159b) den möglichen Fokus (161c); (155) erklärt nicht, wieso hier – anders als in (133) und (138) – eine Fokusprojektion unter Einschluß des Subjekts ((162b,e)) ausgeschlossen ist:

	- b. den *Hund* hat Karl geschlagen
	- c. Fk<sup>2</sup> (159b) = Fk<sup>m</sup> (159b) = den Hund + geschlagen
	- b. Fk<sup>2</sup> (160a) = Karl + geschlagen
	- c. Fk<sup>1</sup> (160b) = den Hund
	- d. Fk<sup>2</sup> (160b) = den Hund + geschlagen (= Fk<sup>m</sup> (159b))
	- e. Fk<sup>3</sup> (160b) = Karl + den Hund + geschlagen

Bartsch stellt nicht nur eine ähnliche Regel wie (155) auf, sondern behauptet (Bartsch 1976: 523) darüber hinaus, daß für Sätze wie (133a,b) das Subjekt Teil des Fokus sein muß. Wir haben gesehen, daß das nicht zutrifft, vgl. (135a,b) und (136a,b). Was (133a,b) auszeichnet, ist vielmehr, daß das an erster Stelle stehende Objekt, im Gegensatz zum Subjekt in (130), nicht Teil des Fokus sein kann. Allgemeiner behauptet Bartsch, daß ein Subjekt, das bei normaler Wortstellung vor einem Objekt steht, bei Nachstellung nicht zum Topik gehören könne. Für Fälle wie (159a,b) ist das Gegenteil richtig: Dort muß das Subjekt (im Gegensatz zu (160a,b)) zum Topik gehören.

3 Explikationen für "normale Betonung" und "normale Wortstellung"

Ich überlasse es künftigen Untersuchungen, die hier wirksamen Regularitäten aufzudecken.<sup>30</sup>

### **2.3.3 Explanatorische Fruchtbarkeit**

Die wichtigste Eigenschaft der Explikation von 'stilistisch normaler Wortstellung' in (147) ist – ähnlich wie bei der Explikation von 'stilistisch normaler Betonung' in (79) –, daß sie nicht nur anhand empirisch kontrollierbarer Eigenschaften gewisse Sätze als 'normal' hinsichtlich der Wortstellung auszeichnet, sondern auch klar macht, inwiefern solche Wortstellungen 'normal' sind. Die von (147) ausgezeichneten Sätze haben bei Normalbetonung innerhalb ihrer EBS*<sup>i</sup>* maximal viele verschiedene Foki (vgl. die MF (48) in (50)); bei nicht-normaler Betonung der gleichen Konstituentenfolge ergibt sich noch eine Reihe von weiteren Fokusmöglichkeiten (vgl. die Diskussion von (52)–(54) und (57)). Vermutlich kann man, sobald ein adäquates System von Hypothesen entwickelt ist, beweisen, daß die Sätze in einer EB*<sup>i</sup>* mit stilistisch normaler Konstituentenabfolge zusammengenommen die meisten möglichen Foki innerhalb ihrer gesamten Menge EBS*<sup>i</sup>* haben, so daß sie, bei geeigneten Betonungen, unter allen grammatisch möglichen Permutationen der Konstituenten die geringsten kontextuellen Restriktionen haben.

Damit sind sie (relativ zu ihrer EBS*<sup>i</sup>* ) so etwas wie ein Allzweckinstrument, und es scheint mir wiederum sehr natürlich, daß viele Sprecher die Benutzung eines solchen Instruments ganz allgemein bevorzugen, insbesondere wenn sie sich darauf verlassen (zu können glauben), daß der RK die bei normaler Wortstellung besonders häufigen Fokusambiguitäten neutralisiert.

Dies klärt auch ein traditionelles Problem der deutschen Topologie, das in empirischer wie in methodologischer Hinsicht einiges Interesse verdient. Nach Ansicht mancher Autoren sind Sätze wie (163a,b) 1-deutig, insofern *ein Mädchen* nur Objekt sein könne. (So zu (163b) z. B. Griesbach (1961 (IV): 89)). Das ist überraschend, denn im Allgemeinen ist hier die Stellung

	- b. morgen wird sie ein Mädchen beißen

<sup>30</sup>Man beachte auch, daß nach (155) nur einer der Sätze in (130) normale Wortstellung haben könnte: Wenn die Abfolge Dativ *>* Akkusativ in (130a) normal ist, dürfte bei der Abfolge Akkusativ *>* Dativ in (130b) das Akkusativobjekt nicht Teil eines Fokus sein, und die Projektion zu MK (130b) wäre ausgeschlossen. Das entspräche zwar der Behauptung mancher Autoren, wird aber vom Urteil vieler Sprecher widerlegt; vgl. die Diskussion zu (98). – Für die entsprechenden Beispiele mit *zeig-* macht (155) allerdings genau die richtigen Voraussagen; vgl. Fn. 23.

des Subjekts nach dem Objekt nicht weniger akzeptabel als die Stellung vor dem Objekt:<sup>31</sup>

	- b. der Mann hat ein Mädchen gebissen
	- b. morgen wird er ein Mädchen beißen

Die Autoren, die für (163) Eindeutigkeit behaupten, tun dies eigenartigerweise gewöhnlich ohne weiteren Kommentar, als sei das eine gewissermaßen selbstverständliche und höchst natürliche Regularität.<sup>32</sup> Tatsächlich wirft diese Behaup-

	- b. weil der *Mann* ein Mädchen gebissen hat
	- c. weil der Mann ein Mädchen *gebissen* hat
	- b. weil das Mädchen ein *Mann* gebissen hat
	- c. weil das Mädchen ein Mann *gebissen* hat

Dementsprechend sind (iii.a,c) für alle Sprecher 1-deutig, und für die Sprecher; die (ii.b) ablehnen, ist auch (iii.b) 1-deutig. Für viele Sprecher, die (ii.b) akzeptieren, ist (iii.b) erwartungsgemäß 2-deutig.

	- b. weil die Frau ein *Mädchen* gebissen hat
	- c. weil die Frau ein Mädchen *gebissen* hat

<sup>32</sup>Für die angebliche Regularität werden zudem verschiedene Regelformulierungen vorgeschlagen. Wenn man Sätze wie (i) berücksichtigt, kann es in (163) allenfalls um die Vermeidung von Ambiguitäten gehen. Einige behaupten jedoch, die relevante Bedingung sei phonologische

	- b. da sie meistens Germanisten ersonnen haben

Nicht-Unterscheidbarkeit der Kasus. Demnach müßten (ia,b) eindeutig synonym mit (iia,b) sein. Da die meisten Sprecher (ii) – im Gegensatz zu (i) – als semantisch abweichend beurteilen, kann Kasussynkretismus nicht die relevante (sondern allenfalls eine notwendige) Bedingung sein.

	- b. da von ihnen meistens Germanisten ersonnen worden sind

<sup>31</sup>Manchmal wird die Behauptung, die für (163) gelten soll, auch mit nominalem Subjekt und Objekt im Mittelfeld illustriert (z. B. in Griesbach 1960 (II): 142); hier ist die Lage aber etwas anders. Während (i) für alle Sprecher akzeptabel ist und (ii.a,c) wohl für alle Sprecher unakzeptabel sind, gibt es bei (ii.b) mit nachgestelltem betonten Subjekt einen Idiolektunterschied: Für viele Sprecher ist (ii.b) unakzeptabel; für viele ist er voll akzeptabel.

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

tung aber zwei schwerwiegende Erlärungsprobleme auf: (a) Wie ist es überhaupt möglich, daß (163) 1-deutig ist, wenn die topologischen Regeln doch (164) und (165) zulassen, und (b) wieso soll gerade die Interpretation mit Subjekt vor Objekt die einzig mögliche sein und nicht die umgekehrte?

Tatsächlich ist immer schon bestritten worden, daß (163) 1-deutig sei; vgl. Erdmann zu (163a):

(166) " Wenn manche Grammatiker empfohlen haben, den Nominativ und Accusativ gleicher Form dadurch zu unterscheiden, daß jener vor, dieser hinter das Verbum gestellt werde, so trafen sie damit ebenfalls keine im Sprachgefühle der Deutschen lebendige Richtung. Ein Satz wie: *Cäsar besiegte Pompejus* wird im Deutschen immer zweideutig sein; wer die Zweideutigkeit vermeiden will, der muss zu anderen Mitteln greifen, als zu der Unterscheidung durch die Wortfolge. Dazu wird der Stilist raten, aber der Grammatiker kann den Satz nicht für unrichtig erklären." (Erdmann 1886: 183)

Im Zusammenhang mit dem Typ (163b) gibt Mentrup einen Hinweis:

(167) " Gestern hat *ihn Karl* gesprochen […]. (Seltener:) Gestern hat *Karl ihn* gesprochen. (Zur Vermeidung von Mißverständnissen:) Gestern hat *meine Mutter/das Mädchen* sie (= Objekt) gesehen." (Duden 1973: § 1524)

Mit der Formulierung " zur Vermeidung von Mißverständnissen" scheint er sagen zu wollen: In (168a) könnte *sie* nach den topologischen Regeln Subjekt oder Objekt sein. In (168b) kann sie (aufgrund der topologischen Regeln) nur Objekt sein. Wenn man Mißverständnisse

	- b. gestern hat meine Mutter/das Mädchen sie gesehen

vermeiden will – und das sollte man tun –, dann wird man nur (168b) wählen, wenn *sie* Objekt ist.

Wenn ein Sprecher kooperativ ist und so weit wie möglich Ambiguitäten vermeidet, ist das in der Tat eine plausible Strategie. Ein Hörer, der mit einem derart kooperativen Sprecher rechnet, wird erwarten, daß die Objektfunktion von *sie* eindeutig kenntlich gemacht ist, also nur (168b) erwarten; in (168a) ist *sie* für ihn dann eindeutig Subjekt. Andererseits läßt diese Strategie genügend Spielraum, um *sie* auch als Objekt in (168a) zuzulassen, wenn Hörer und Sprecher aufgrund des Kontexts nicht mit möglichen Mißverständnissen rechnen.

Die Annahme einer solchen Strategie könnte erklären, wieso jemand geneigt ist, (163b) entgegen den allgemeinen topologischen Regeln in der besprochenen Weise für 1-deutig zu halten. Sie hat jedoch keinerlei Erklärungswert für (163a).

Denn wenn wir zugestehen, daß (163a) gemäß den topologischen Regeln – und in Übereinstimmung mit der Intuition sehr vieler (wenn nicht aller) Sprecher – 2 deutig ist, gibt es nicht wie in (168) eine 1-deutige Formulierungsalternative, die verständlich machen würde, warum (163a) als 1-deutig interpretiert wird. Insbesondere hilft auch der vielleicht naheliegende Verweis auf das Passiv nicht: Zwar ist (169) 1-deutig, aber warum sollte

	- b. ein Mädchen ist von der Frau gebissen worden

etwa (169a) als 1-deutige Alternative gewählt werden, wenn *Mädchen* in (163a) als Subjekt intendiert ist, und nicht vielmehr (169b), wenn *Frau* in (163a) Subjekt sein soll? Entsprechend für die Objektinterpretation und (169b).

Interessanterweise bleibt das Erklärungsproblem auch dann bestehen, wenn man die Behauptung, (163a) sei 1-deutig, zurückweist. Denn es scheint mir sehr deutlich, daß auch für jene Sprecher, für die (163a,b) klar 2-deutig sind, die Interpretation mit *Mädchen* als Objekt intuitiv näherliegend ist. Über diese Interpretation verfügt man sofort beim Hören des Satzes, und zwar unabhängig davon, ob *Frau* bzw. *sie* oder *Mädchen* betont ist (d. h. auch bei nicht-normaler Betonung), während es außerhalb eines entsprechenden Kontexts einen Augenblick des Überlegens braucht, *Mädchen* als mögliches Subjekt zu erkennen.

Nach unseren Erörterungen über stilistisch normale Wortstellung drängt sich die Erklärung für diese Fakten auf: Außerhalb von desambiguierenden Kontexten bevorzugt der Hörer eine Interpretation, die der normalen Wortstellung entspricht. Und dies ist verständlich, denn wie wir gesehen haben, ist unter normaler Wortstellung die Anzahl der prinzipiell möglichen Kontexttypen am größten; diese Interpretation ist daher eine relativ sichere Interpretation. Hinsichtlich des Sprechers bedeutet das, daß von ihm im Zweifelsfall der Gebrauch der normalen Wortstellung zu erwarten ist, da diese pragmatisch am vielseitigsten zu verwenden ist.

Unsere Explikation von stilistisch normaler Wortstellung leistet damit eine Erklärung in einem Bereich, dessen Erklärungsbedürftigkeit traditionell nicht einmal erkannt worden ist.

### **3 Strukturell normale Wortstellung**

Im vorigen Abschnitt haben wir eine Explikation von 'stilistisch normaler Wortstellung' besprochen. In der sprachwissenschaftlichen Tradition findet dieser intuitive Begriff relativ wenig Beachtung; wo von 'normaler Wortstellung' die Rede

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

ist, scheint meist ein anderer Begriff gemeint zu sein, der allerdings kaum je erläutert wird. Der einzige mir bekannte Versuch dazu stammt von Lenerz. Dank seiner expliziten – und für die deutsche Topologie sehr wichtigen – Darstellung ist es möglich, im folgenden die Aspekte zu besprechen, in denen sich dieser andere Begriff von 'normaler Wortstellung' wesentlich von der Explikation (147) unterscheidet. Lenerz erklärt:

(170) " Wenn zwei Satzglieder A und B sowohl in der Abfolge AB wie auch in der Abfolge BA auftreten können, und wenn BA nur unter bestimmten, testbaren Bedingungen auftreten kann, denen AB nicht unterliegt, dann ist AB die " unmarkierte Abfolge" und BA die " markierte Abfolge"." (Lenerz 1977: 27 (14))

(Die Prüfung der möglichen Abfolgen für gegebene A und B ist dabei im wesentlichen – aus guten Gründen, vgl. Fn. 29 – auf das Mittelfeld beschränkt.)

Ich schlage zunächst in (171) eine alternative Formulierung für (170) vor. Anhand der Besprechung der Formulierungsunterschiede wird deutlicher hervortreten, wie (170) gemeint ist und welchen Gebrauch Lenerz von (170) macht.

(171) *Definition:*

Wenn zwei Konstituententypen KT1 und KT2 in der Abfolge KT1 *>* KT2 unter strukturellen Bedingungen MB1 und in der Abfolge KT2 *>* KT1 unter strukturellen Bedingungen MB2 vorkommen können, wobei MB2 *⊂* MB1, dann ist KT1 *>* KT2 die *strukturell normale Abfolge* und KT2 *>* KT1 eine *strukturell markierte Abfolge*.

Diese Formulierung weicht in etlichen Einzelheiten von (170) ab. Der Ersatz von " AB" in (170) durch " KT1 *>* KT2" in (171) ist nötig, weil Lenerz für die Normalität von Abfolgen Transitivität annimmt; d. h. wenn AB und BC normal sind, sollen auch ABC und AC normal sein; vgl. z. B. S. 86.<sup>33</sup>

Ein unwesentlicher Unterschied ist, daß nach (170) die Abfolge B *>* A auftreten kann, während die Formulierung in (171) zuläßt, daß MB2 = *∅*, d. h. daß B *>* A unakzeptabel ist. Es scheint mir sinnvoll, die Abfolge A *>* B auch dann als 'strukturell normal' zu bezeichnen, wenn sie die einzig mögliche ist; aber das ist bei Bedarf leicht zu ändern.

In (171) ist MB2 als echte Untermenge von MB1 bestimmt; (170) dagegen läßt, wörtlich genommen, eine komplementäre Verteilung von A *>* B und B *>* A zu, d. h. MB1 *∩* MB2 = *∅*. Aus seiner Praxis ist klar, daß Lenerz nur den in (171) formulierten Fall meint.

<sup>33</sup>Mit dieser Annahme gibt es jedoch empirische Probleme, vgl. Lenerz (1977: 88f).

Nach (170) und (171) ist daher 'strukturell normale Abfolge' nur für MB2 *⊂* MB1, d. h. für (MB1 *∪* MB2 = MB1) & (MB1 *̸*= MB2) erklärt. Es wäre an sich auch möglich und einleuchtend, auf die Bedingung MB1 *̸*= MB2 zu verzichten, d. h. sowohl A *>* B als auch B *>* A als 'normale' Abfolgen zu bezeichnen, wenn sie (hinsichtlich struktureller Bedingungen) frei variieren. Einen solchen Fall hat Lenerz nicht vorgesehen.

Aus dieser Tatsache sowie dem Umstand, daß er im Grundsatz Transitivität der Relation 'normale Abfolge' annimmt und komplementäre Verteilung ausschließt, muß man schließen, daß es – jedenfalls für sein Untersuchungsgebiet – für alle Folgen von 'Satzgliedern' (so in (170); in (171): Konstituententypen) genau eine vollständig bestimmte 'normale Abfolge' gibt, die unter allen strukturellen Bedingungen möglich ist. Dies könnte – was Lenerz nicht eigens diskutiert – eine interessante empirische Annahme sein. Wir werden jedoch gleich sehen, daß sie das nicht ist.

Da freie Variation nicht zugelassen ist, heißt es in (170) wie in (171), daß KT1 *>* KT2 *die* normale Abfolge ist. Dagegen bezeichne ich KT2 *>* KT1 als *eine* markierte Abfolge, während B *>* A in (170) als *die* markierte Abfolge bezeichnet wird. Grund: Es ist der Fall denkbar, daß es KT1 *>* KT2 unter MB1, KT2 *>* KT1 unter MB2 und KT2 *>* KT1 unter MB3 gibt, wobei MB2 *⊂* MB1 und MB3 *⊂* MB1, aber MB2 *̸*= MB3. Hier tritt ein wichtiges Problem zutage, das weniger in der Formulierung von (170) selbst als vielmehr in dem Gebrauch liegt, den Lenerz von seiner Definition macht. Die Bedingungen, denen A *>* B und B *>* A unterliegen, sind nämlich in seinen Untersuchungen keine kontextuellen Bedingungen (etwa so, daß die Abfolgen C *>* A *>* B *>* D, C *>* B *>* A *>* D und E *>* A *>* B *>* D, aber nicht E *>* B *>* A *>* D möglich wären). Die Bedingungen MB1, MB2 usw. sind vielmehr Eigenschaften der jeweils untersuchten Konstituententypen selbst, ebenso wie es eine Eigenschaft dieser Konstituenten ist, dem Typ A bzw. B anzugehören. Wenn wir die Eigenschaften der Konstituententypen durch Merkmale *A, B, … E1, E2, …* mit einem Vorzeichen notieren (wobei " +" heißt, daß der Konstituententyp die fragliche Eigenschaft hat; " –", daß er sie nicht hat; und " o", daß er sie hat oder nicht hat) dann ist [+*A*] *>* [+*B*] z. B. dann strukturell normal, wenn (172a,b) akzeptabel und (172c) unakzeptabel ist:

(172) a. [+*A, oE1*] *>* [+*B, oE1*] b. [+*B, oE1*] *>* [+*A*, +*E1*] c. [+*B, oE1*] *>* [+*A*, -*E1*]

Der oben angenommene Fall, daß MB2 *̸*= MB3, stellt sich dann so dar, daß z. B. (173a–c) akzeptabel sind, nicht aber (173d,e):

3 Explikationen für "normale Betonung" und "normale Wortstellung"

	- d. [+*B*, +*E1*] *>* [+*A*, +*E1*]
	- e. [+*B*, -*E1*] *>* [+*A*, -*E1*]

Um (170) auf diese Situation anzuwenden, gibt es zwei Möglichkeiten: Entweder formuliert man die Bedingung: KT2 *>* KT1 als eine Disjunktion von Bedingungen: KT2 *>* KT1 ist möglich wenn KT1 [+*A*], KT2 = [+*B*] *und* ((KT1 = [-*E1*] und KT2 = [+*E1*]) *oder* (KT1 = [+*E1*] und KT2 = [-*E1*])). Dann ist es etwas irreführend, zu sagen, KT2 *>* KT1 sei *die* markierte Abfolge, denn die beiden Konstituententypen müssen ja recht verschiedene Kombinationen von Eigenschaften ('Bedingungen') erfüllen, um in der Abfolge KT2 *>* KT1 vorkommen zu können. Oder aber man betrachtet nicht mehr [+*A*] und [+*B*] als die für KT1 bzw. KT2 charakteristischen Eigenschaften, sondern z. B. die Kombination [+*A*, -*E1*] bzw. [+*A*, +*E1*]. In diesem Fall erhält man das Resultat, daß [+*A*, -*E1*] *>* [+*B*] *die* normale und [+*B*] *>* [+*A*, -*E1*] *die* markierte Abfolge ist, und daß [+*A*, +*E1*] *>* [+*B*] *die* normale und [+*B*] *>* [+*A*, +*E1*] *die* markierte Abfolge ist. Dann ist aber nicht, wie es offenbar eigentlich angestrebt ist, terminologisch erfaßt, daß [*+B*] *>* [+*A*] besonderen Bedingungen unterliegt, denen [+*A*] *>* [+*B*] nicht unterliegt.

Diese Interpretation von (170), (171) läßt also eine beträchtliche Freiheit, welche Eigenschaften und vor allem Kombinationen von Eigenschaften man als charakteristisch für KT1 und KT2 ansieht, welches demnach die für die Abfolge relevanten 'Bedingungen' sind und demzufolge auch, welche Abfolge 'normal' bzw. 'markiert' ist. Dies macht sich Lenerz an einigen Stellen zunutze.

Zu den von ihm berücksichtigten Eigenschaften gehören besonders: welche Relationen KT1 und KT2 zum Verb haben (Subjekt, indirektes (= Dativ-) Objekt, direktes (= Akkusativ-) Objekt, 'freie Dative', …, temporale Adverbiale, …); ob sie betont oder unbetont sind; ob sie Personalpronomen oder Substantive sind. Er stellt fest, daß für unbetonte rein 'kasuelle' (nicht in einer PP enthaltene) Personalpronomen z. T. andere Regularitäten als für substantivische NPs gelten. So ist nach seinen Daten aufgrund von (170) für Substantive die Abfolge Dativ *>* Akkusativ normal und Akkusativ *>* Dativ markiert; dagegen ist Akkusativ *>* Dativ die einzig mögliche Abfolge, wenn der Akkusativ ein unbetontes Personalpronomen ist. Ebenso ist nach seinen Kriterien bei gewissen Verben die Abfolge Objekt *>* Subjekt normal; ist das Subjekt ein unbetontes Personalpronomen, ist dagegen nur Subjekt *>* Objekt möglich. Um überhaupt Aussagen über normale/markierte Abfolgen im Sinne seiner Definition machen zu können, muß er also Kombinatio-

nen von Eigenschaften als Charakteristika für KT1 und/oder KT2 verwenden, z. B. [+*Subjekt*, +*Personalpronomen*, -*betont*]. Daher ist die Rede von " Satzgliedern A und B" in (170) – darunter versteht er Konstituenten in bestimmter syntaktischer Relation zum Verb, z. B. Subjekt, Objekt, Adverbiale usw. – irreführend und in (171) durch " Konstituententypen KT1 und KT2" ersetzt: Sie suggeriert, daß die Eigenschaft, dem Satzgliedtyp A bzw. B anzugehören, die charakteristische Eigenschaft sei, während alle anderen Eigenschaften der betrachteten Konstituenten zu den relevanten 'Bedingungen' gehören. Dies ist, wie wir gesehen haben, unzutreffend: Neben dem Satzgliedtyp (oder u. U. statt dessen) dienen nach Bedarf auch [± *betont*] und [± *Personalpronomen*] als charakteristische Eigenschaften.

Mit Hilfe der Kombination von Eigenschaften läßt sich auch das Problem komplementärer Verteilungen leicht lösen. Wenn z. B. (174a,b) akzeptabel und (174c,d) unakzeptabel sind, sind (170) und (171) nicht

(174) a. [+*A*, +*E1*] *>* [+*B*, -*E1*] b. [+*B*, +*E1*] *>* [+*A*, -*E1*] c. [+*A*, -*E1*] *>* [+*B*, +*E1*] d. [+*B*, -*E1*] *>* [+*A*, +*E1*]

anwendbar, wenn [+*A*] und [+*B*] als charakteristische Eigenschaften der Konstituententypen betrachtet werden, und weder (174a) noch (174b) kann als normal oder markiert ausgezeichnet werden. Wir können aber einfach die Kombinationen [+*A*, +*E1*] und [+*B*, -*E1*] bzw. [+*A*, -*E1*] und [+*B*, +*E1*] als Charakteristika von KT1 bzw. KT2 betrachten. Da für diese Kombination (174a) bzw. (174b) die einzig möglichen Abfolgen sind, sind sie dann nach (171) jeweils normal.<sup>34</sup>

Durch solche Freiheiten bei der Bestimmung der charakteristischen Eigenschaften von KT1 und KT2 läßt sich die Forderung, eine normale Abfolge für alle Konstituententypen des Satzes festzulegen, ohne Schwierigkeiten erfüllen. Aber im gleichen Maße schwindet natürlich das mögliche empirische Interesse an einem so flexiblen Begriff von 'normaler Abfolge'.

Auf den wichtigsten Unterschied zwischen (170) und (171) sind wir jedoch noch nicht zu sprechen gekommen.

In (170) ist allgemein von 'Bedingungen', in (171) dagegen von 'strukturellen Bedingungen' die Rede. Darunter verstehe ich syntaktische, morphologische, logische und phonologische (incl. intonatorische und akzentuelle) Eigenschaften, nicht aber pragmatische.

<sup>34</sup>In diesem Fall geht es natürlich noch einfacher, wenn [+*E1*] und [-*E1*] als Charakteristika gewählt werden: Dann ist [+*E1*] *>* [-*E1*] die einzig mögliche (und nach (171) normale) Abfolge. Diese Vereinfachung ist nicht möglich, wenn es neben (174a,b) z. B. auch [+*C*, -*E1*] *>* (+*A*, +*E1*] gibt.

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

Dies ist nötig, wenn man der von Lenerz befolgten Praxis Rechnung tragen will. Andernfalls könnte man z. B. sagen, daß (175b) eine markierte Wortstellung aufweist und (175a) eine normale, da (175a) in demselben Kontexttyp vorkommen kann wie (175b), außerdem aber noch in vier weiteren; vgl. (101). Dies stände in völligem Widerspruch zu

	- b. Karl hat dem *Mann* das Buch gegeben

Lenerz' – in sich konsistenten – Ergebnissen, nach denen es gerade umgekehrt ist. (Wir erinnern uns, daß nach (147) und (79) sowohl (175a) als auch (175b) stilistisch normale Wortstellung haben; (175a) hat stilistisch normale, (175b) stilistisch nichtnormale Betonung.)

Die Art, wie Lenerz Beispiele in seine Untersuchungen einführt, könnte vermuten lassen, daß es ihm, im Gegensatz zu (171), sogar ganz ausdrücklich um pragmatische Zusammenhänge geht. So gibt er den Beispielen, die er diskutiert, gewöhnlich einen 'Fragetest' bei, und seine Regeln formuliert er unter Verwendung der Ausdrücke " Thema" (entspricht 'Topik') und " Rhema" (entspricht 'Fokus'); dies sind nach unserer und seiner (Lenerz 1977: 11ff) Explikation pragmatische Begriffe. So z. B.

(176) " (3) Was hast du dem Kassierer gegeben?

(3) a) Ich habe dem Kassierer das *Geld* gegeben.

(3) b) ?\* Ich habe das *Geld* dem Kassierer gegeben.

Im Kontext (3), der DO als Rhema eindeutig festlegt, ist nur die Antwort (3) a) akzeptabel, also die Abfolge IO DO. Die Abfolge DO IO scheidet also aus, wenn DO das Rhema ist!" (Lenerz 1977: 43)

Diese Ausdrucksweise ist jedoch irreführend. Es ist für Lenerz völlig belanglos, was in (3) a), b) Fokus ist: In (3) a) gibt es 5 verschiedene Möglicheiten; in (3) b) für die Sprecher, die den Satz akzeptieren, genau eine, und zwar mit dem DO als Fokus. Dementsprechend prüft er auch nicht, ob (3) b) in irgendeinem anderen Kontext als (3) geäußert werden könnte, sondern ihm reicht die Feststellung, daß (3) b) *mit dieser Betonung* für ihn unakzeptabel ist. Es geht also gar nicht darum, daß *im Kontext* (3) die *Antwort* (3) b) 'unakzeptabel' ist, sondern der *Satz* (3) b) ist (für ihn) unakzeptabel. Es trifft ja auch keineswegs zu, daß der Kontext (3) das DO in (3) a), b) als Fokus festlegt. Vielmehr ist durch die Betonung in (3) a) festgelegt, daß *das Geld* ein möglicher Fokus ist und daß deshalb (3) a) in einem Kontext, wie er durch (3) angedeutet wird, ohne Verletzung konversationeller Maximen geäußert werden kann. In beliebigen anderen Kontexten, etwa (177), andert sich an der Akzeptabilität von (3) a), b) und an den Fokusmöglichkeiten nicht das geringste, nur würde es gegen die

### (177) wem hast du das Geld gegeben?

Maximen verstoßen, ihn dort zu äußern. Hier wie in allen anderen Fällen macht Lenerz allein die Akzeptabilitätsbeurteilung von Sätzen mit einer gegebenen Betonung zur Grundlage seiner Feststellungen über markierte und unmarkierte Konstituentenfolgen. Die beigegebenen Fragen dienen keineswegs dazu, mögliche Foki zu eruieren; sie können allenfalls, indem sie einen natürlichen Kontext andeuten, die oft sehr delikate Akzeptabilitätsbeurteilung erleichtern.

In dieser Hilfsfunktion sind die Fragen natürlich nützlich; aber solche scheinbar auf pragmatische Regularitäten zielenden Formulierungen wie in (176) sind doch überraschend. Möglicherweise sind sie auf ein Mißverständnis zurückzuführen: Lenerz möchte die Regularitäten, die er untersucht, einerseits zu Danešs 'weak rules' rechnen (wohl weil er sieht, daß Wortstellungs- und Betonungsunterschiede etwas mit Fokusunterschieden zu tun haben, die Daneš durch eben solche 'weak rules' beschreiben möchte), vgl. Lenerz (1977: 26f). Andererseits will er aber die Akzeptabilitätsbeurteilung zur Grundlage seiner Klassifikation in 'normale' vs. 'markierte' Abfolgen machen. Dieser Unterschied ist wesentlich: Für Danešs 'weak rules' ist relevant, wie die intuitive 'Normalitätsbeurteilung' *akzeptabler* Sätze mit Topik/Fokus-Unterschieden zusammenhängt. Wenn (3) b) in (176) unakzeptabel ist, kann dies nicht auf die Wirkung einer 'weak rule' zurückgehen; Daneš führt solche Fälle auf 'concomitant rules' zurück, vgl. das Zitat in Lenerz (1977: 27). Die Unakzeptabilität dieses Beispiels ist aber nach (170) eine wesentliche Grundlage dafür, die Abfolge DO *>* IO als markiert zu bezeichnen.

In Zusammenhang mit dieser strukturellen, nicht-pragmatischen Orientierung von (170) steht die Tatsache, daß ich in (171) nicht von 'Konstituenten' spreche, sondern von 'Konstituententypen'. Die Formulierung in (170) läßt offen, ob der Vergleich der Abfolgen A *>* B und B *>* A jeweils nur innerhalb einer Menge EBS\* i stattfinden soll, die aus Elementen einer Menge EBS*<sup>i</sup>* wie in (76c) und allen genau entsprechenden aber unakzeptablen Sätzen besteht – dann stehen primär nur Konstituenten, nicht Konstituententypen zur Debatte –, oder ob über Satztypen – und damit Konstituententypen – Aussagen gemacht werden sollen. Wenn man sieht, wie generell Lenerz die Eigenschaften der betrachteten Konstituenten(typen) – ihre charakteristischen Eigenschaften wie die 'Bedingungen', unter denen eine Abfolge möglich oder unmöglich ist – formuliert, ist es klar, daß es ihm ganz entschieden auf Satztypen ankommt. Daher kommt er auch z. B. zu dem – in sich konsistenten – Schluß, daß in (175a) eine markierte Abfolge vorliegt. Das ist bemerkenswert, weil der Satz intuitiv nach seinem Urteil wie nach dem Urteil anderer Sprecher (und unter der Explikation (147)) stilistisch völlig unauffällig, 'normal' und 'unmarkiert' ist.

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

Im Gegensatz dazu ist (147) eine Explikation des intuitiven Begriffs der normalen Wortstellung und jeweils auf Sätze (als Elemente einer EBS*<sup>i</sup>* ) bezogen, nicht auf Satztypen. Zum einen ist das aufgrund der pragmatischen Natur der Explikation technisch notwendig: Sie baut, genau wie die Explikation von 'stilistisch normaler Betonung', auf der Topik/Fokus-Unterscheidung, d. h. auf möglichen Kontexttypen, auf. Kontexttypen sind primär aber nicht für Satztypen zu bestimmen, sondern für Sätze. Dieses Vorgehen scheint zum andern auch adäquat, indem es z. B. (175a) als stilistisch normal auszeichnet. (Das bedeutet natürlich nicht, daß diese Explikation bei der Betrachtung von einzelnen Sätzen stehen zu bleiben hätte. Im Gegenteil: Sie provoziert die Suche nach allgemeinen Regeln der Fokusprojektion, und diese werden natürlicherweise für Klassen von EBS*<sup>i</sup>* formuliert.)

Insofern (147) die Explikation von unmittelbaren Sprecherintuitionen ist, ist sie sprachwissenschaftlich relevant, und sie ist essentiell, insofern sie eben deshalb nicht definitorisch auf unabhängig begründete Begriffe zurückgeführt werden kann. Allerdings kann man angeben, unter welchen Bedingungen eine Wortstellung als stilistisch normal empfunden wird, und man kann, wie wir gesehen haben, sogar erklären, warum gerade diese Abfolge so empfunden wird, was an ihr also 'normal' ist. Gilt das gleiche für (171)?

Zunächst ist klar, daß 'strukturell normale Abfolge' nach (171) kein essentieller Begriff ist: Lenerz beginnt seine Abhandlung nicht mit der Untersuchung intuitiver Urteile über normale und markierte Abfolgen, sondern mit einer Definition, die festlegt, daß für das Vorliegen gewisser Akzeptabilitätsverteilungen bei Konstituententypen mit gegebenen strukturellen Eigenschaften der Ausdruck " normale (unmarkierte)" bzw. " markierte Abfolge" gebraucht wird. Selbstverständlich setzt Lenerz dabei voraus, daß es Aufgabe der Grammatik ist, akzeptable von unakzeptablen (bzw. grammatische von ungrammatischen) Sätzen zu unterscheiden. Von den dafür nötigen grammatischen Regeln abstrahiert (171) insofern, als die Definition nur noch sagt, *daß* eine gewisse Abfolge nur unter eingeschränkten Bedingungen vorkommt, während die Regeln der Grammatik angeben, unter *welchen* Bedingungen sie möglich ist. Hinsichtlich strukturell normaler Abfolgen sagt sie dasselbe wie die Regeln der Grammatik: daß sie unter allen strukturellen 'Bedingungen' möglich ist. Es wäre danach etwas überraschend, wenn 'strukturell normale Abfolge' sich als ein relevanter Begriff erweisen sollte.<sup>35</sup>

Daß dies ein relevanter Begriff ist, wird offenbar in vielen traditionellen Grammatiken implizit angenommen. Die Behauptung z. B., die Folge Dativ *>* Akkusa-

<sup>35</sup>Alles, was wir hier über strukturell normale Abfolgen ausgeführt haben, trifft mutatis mutandis auch für die strukturell normalen Betonungen von Fuchs zu, vgl. Fn. 22.

tiv sei 'die normale Abfolge', findet sich in vielen Arbeiten zum Deutschen – aber fast ausnahmslos ohne Erläuterung. Es ist eins von Lenerz' Verdiensten, daß er zum ersten Mal geklärt hat, in welchem Sinne – und mit welcher Berechtigung – eine solche Behauptung überhaupt erhoben werden kann; aber dadurch ist ihre Relevanz noch nicht demonstriert. (Für einen Sprachlerner mag es nützlich sein, sich einzuprägen, welche Abfolgen keinen strukturellen Einschränkungen unterliegen; aber ein didaktischer Gesichtspunkt ist nicht per se von Interesse für die Sprach- und Grammatiktheorie.)

Diese traditionelle Annahme ist häufig in transformationelle Grammatiken übernommen und ohne weitere Reflexion mit der Annahme verknüpft worden, strukturell normale Abfolgen müßten *als solche* auf einer 'Ebene' der Syntax repräsentiert werden, es müsse also eine Ebene geben, auf der nur normale Abfolgen repräsentiert sind. Da dies offensichtlich nicht die Oberflächenstruktur sein kann, muß es in transformationellen Grammatiken des klassischen Typs die Tiefenstruktur sein. Aber hier wird wiederum vorausgesetzt, was erst zu beweisen wäre: daß 'Normalität' im Sinne von (171) als solche auf einer syntaktischen Ebene repräsentiert werden muß. Natürlich ist es im Grundsatz möglich, daß eine empirisch adäquate transformationelle Grammatik Tiefenstrukturen generiert, die nur strukturell normale Abfolgen aufweisen. (Streng genommen hieße das, daß es in einer solchen Grammatik weder obligatorische Bewegungstransformationen noch irgendwelche kontextsensitiven Filter gäbe.) Eine empirisch adäquate Grammatik würde solche Tiefenstrukturen jedoch aus guten empirischen Gründen aufweisen, nicht *weil* man eine Definition wie (171) aufstellen kann.

Lenerz schließt sich der Auffassung an, daß die (für Substantive) strukturell normale Abfolge IO *>* DO zugrunde liegt, versucht dafür jedoch eine Begründung zu geben:

(178) " [Es] läßt sich zumindest versuchsweise die *Bedingung*, der die markierte Abfolge DO IO unterliegt, als *Begründung* für eine Umstellung interpretieren. Unter diesem Gesichtspunkt ist es zumindest eine der *Funktionen* der Abfolge DO IO, ein rhematisches IO näher an das Ende des Satzes zu stellen, als es die Abfolge IO DO erlaubt. [… D]ie Umstellung von IO DO zu DO IO hat genau dann *keine Funktion*, wenn dadurch das Rhema DO näher zum Satzanfang gestellt wird, während es doch in der Abfolge IO DO schon in der *optimalen Stellung* war, nämlich näher am Satzende […] Dieser *Erklärungsversuch* fußt auf der Annahme, daß IO DO die unmarkierte Abfolge der Objekte ist, *von der ausgehend* Umstellungen vorgenommen werden, dessen Funktion es ist, das rhematische Element *näher zum Satzende* hin zu bewegen. Wenn man hingegen beide Abfolgen als

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

gleichberechtigt ansieht, kann man die Asymmetrie nicht erklären, die darin besteht, daß in der Abfolge IO DO auch das linke Element, nämlich das IO [,] das Rhema sein kann, während in der Abfolge DO IO *nur das rechte Element* Rhema sein kann." (Lenerz 1977: 45; Hervorhebungen von mir)

(Was Lenerz hier 'Rhema' nennt, wäre genauer als 'Teil des minimalen Fokus' zu bezeichnen).

Der Erklärungswert der Annahme hängt offenbar davon ab, daß (a) Umstellungsregeln eine 'thematische Funktion' haben müssen (sonst spräche nichts dagegen, ein 'rhematisches DO' aus der Normalfolge in die Abfolge DO *>* IO umzustellen), und daß (b) die Position am Ende des Mittelfelds die 'optimale' Stellung für ein 'Rhema' ist. Gegen beide Annahmen sind jedoch Einwände zu erheben. Vor allem gibt es unmittelbare empirische Gegengründe. So sind (179a,b) (= Lenerz 1977: 44 (5a,b)) für Lenerz voll akzeptabel:

(179) a. ich habe dem *Kassierer* das *Geld* gegeben b. ich habe das *Geld* dem *Kassierer* gegeben

In (179b) wäre jedoch das DO als Teil des 'Rhemas' in eine 'nicht-optimale' Position näher zum Satzanfang umgestellt, was nach diesen Annahmen nicht sein kann. (Der letzte Satz von (178) ist mit diesem Beispiel nicht verträglich.) Und bei Paaren wie (180a,b) (= Lenerz 1977: 44 (6e,f)) " scheinen" ihm Sätze mit DO *>* IO nur " leicht abweichend zu sein" (S. 44), während die Abweichung in (3) b) von (176) für ihn sehr deutlich ist:

	- b. ich habe das Geld dem Kassierer *gestern* gegeben

Nach seinen Annahmen müßte (180b) jedoch ganz unmöglich sein. Und warum sollte es nicht eine Umstellung mit 'thematischer Funktion' in eine nicht-optimale Position geben? Die 'Funktion' der Umstellung eines rhematischen DO vor ein nicht-rhematisches IO könnte ja vielleicht sein, daß dadurch mögliche Fokusprojektionen verhindert werden (dies ist ein Effekt van (155)), also Fokusdesambiguierung. Sätze wie (181) werden schließlich allgemein als akzeptabel betrachtet:

	- b. dem *Kind* hat Karl das Buch gegeben

Die Abfolge DO *>* IO auf eine Umstellung aus IO *>* DO zurückzuführen ist demnach wenig begründet. Mir scheint die Vermutung nicht abwegig, daß eigentlich umgekehrt die stillschweigende Annahme, daß es (a) eine (empirisch

signifikante) vollständig bestimmte Normalfolge gibt, die (b) auf einer syntaktischen 'Ebene' als solche zur repräsentieren ist, die ursprüngliche Motivation für die Annahme einer Umstellung und überhaupt für das Interesse an strukturell normalen Abfolgen ist. Im Kontext von Lenerz (1977) ist (178) nämlich etwas überraschend, denn die Bedingungen für markierte Abfolgen formuliert Lenerz im Allgemeinen keineswegs positiv als Bedingungen für Umstellungen. Für das Verhältnis von (substantivischen) IO und DO gibt er zwei wesentliche Bedingungen: eine Definitheitsbedingung (S. 55), auf die ich hier nicht eingehe, und eine 'Thema-Rhema-Bedingung'. Diese lautet in einer ihrer Formulierungen:

(182) " DO IO ist nicht möglich, wenn DO das Rhema und gleichzeitig IO nicht das Rhema ist." (Lenerz 1977: 44 (4c))

(Diese Formulierung trägt u. a. (179), (180) Rechnung.) Diese Bedingung hat zwei wichtige Aspekte. (a) Sie setzt voraus, daß alle Abfolgen, die ihr nicht widersprechen, vorkommen können. Bei wörtlichem Verständnis wird man sie daher nicht als Kontextprädikat einer Transformationsregel ('Umstellung') interpretieren (was technisch auch nahezu unmöglich wäre, wenn man (175), (179) und (180) berücksichtigt), sondern negativ als Oberflächenrestriktion (Filter), die gewisse von der Grammatik generierte Konstituentenfolgen als ungrammatisch markiert. (b) Dadurch daß alle anderen Abfolgen implizit als möglich gekennzeichnet werden, geht aus (182) unmittelbar hervor, daß DO *>* IO im Sinne von (171) eine markierte und IO *>* DO die normale Abfolge ist. Eine zusätzliche Auszeichnung der normalen Abfolge ist nicht nötig. Sie ist nicht 'als solche' repräsentiert, sondern (wie es auch ihrer Definition entspricht) durch (182) für die Oberflächenstruktur charakterisiert.<sup>36</sup>

Ungeklärte Annahmen über Tiefenstrukturen und 'Normalität' verbinden sich nicht selten mit Annahmen über typologische Markiertheit. So könnte man – un-

(ii) \*[+*NP*, -*Personalpronomen*, +*Akkusativ*, +*Fokusteil*] *>* [+*NP*, +*Dativ*, -*Fokusteil*]

Dazu sind noch keine empirischen Untersuchungen unternommen worden.

<sup>36</sup>Es ist klar – (182) zeigt es deutlich –, daß die Beschreibung von topologischen Regularitäten mittels Filtern einer Beschreibung mittels Umstellungsregeln empirisch nicht äquivalent ist. Nach vorläufigen Untersuchungen ergeben sich bei der Benutzung von Filtern für das Mittelfeld größere Generalisierungen.

Wir haben bereits gesehen, daß Lenerz' pragmatische Formulierungen irreführend sind; nach den Untersuchungen, die er wirklich anstellt, wäre (182) korrekter mit Bezug auf Betonungen wie in (i) statt auf Rhema (Fokus) zu formulieren:

<sup>(</sup>i) \*[+*NP*, -*Personalpronomen*, +*Akkusativ*, +*betont*] *>* [+*NP*, +*Dativ*, -*betont*]

Es wäre eine in mancher Hinsicht interessante (empirisch nicht äquivalente) Alternative, Formulierungen wie (182) wörtlich zu nehmen und (a) Fokusregeln auch für unakzeptable Sätze gelten zu lassen, (b) Filter unter Bezug auf Foki (statt auf Betonung) wie in (ii) zu formulieren:

### 3 Explikationen für "normale Betonung" und "normale Wortstellung"

ter Verwendung eines Arguments von Maling (1970) – sagen: Typologisch ist es normal, daß in einer Sprache L*<sup>i</sup>* IO *>* DO *>* Verb normal ist, wenn in L*<sup>i</sup>* IO *>* DO normal ist, und daß in L*<sup>j</sup>* Verb *>* DO *>* IO normal ist, wenn in L*<sup>j</sup>* DO*>* IO normal ist. Im Deutschen ist (a) IO *>* DO strukturell normal; (b) unter Voraussetzung von (a) ist es typologisch normal, daß im Deutschen IO *>* DO *>* Verb strukturell normal ist. (c) Die Abfolge IO *>* DO *>* Verb kommt im Deutschen tatsächlich vor; da sie aus typologischen Gründen als strukturell normal zu betrachten ist, muß sie (d) auf einer syntaktischen Ebene als solche repräsentiert werden; (e) also haben Tiefenstrukturen für deutsche Sätze die Abfolge IO *>* DO *>* Verb.

Hier treten zu den allgemeinen Problemen mit Annahmen über tiefenstrukturelle Abfolgen noch die Probleme der Typologie und Probleme des Zusammenhangs zwischen Typologie und einzelsprachlicher Grammatik. Wir wollen für unsere Zwecke – in starker Idealisierung der tatsächlichen Verhältnisse – annehmen, 'normal' und 'markiert' im typologischen Sinne seien klare und relevante Begriffe.<sup>37</sup> Dies könnte wichtig sein, wenn sich z. B. erweisen würde, daß generell Abfolgen, die nach (171) in Einzelsprachen markiert sind, auch typologisch markiert sind, und umgekehrt. Wenn dies der Fall ist, wäre eine gewisse Relevanz von 'markiert' im Sinne von (171) demonstriert.

Ob es tatsächlich Zusammenhänge dieser Art gibt, können wir hier offen lassen. Für topologische Zwecke ist wichtig, daß selbst dann, wenn es sie gibt, nicht evident ist, ob sie in der Grammatik einer Einzelsprache repräsentiert werden sollten, und wenn ja, wie. A priori-Annahmen wie die, daß strukturell normale Abfolgen einer Einzelsprache, wenn sie typologisch normalen Abfolgen entsprechen, als solche von der Basiskomponente einer transformationellen Grammatik ausgezeichnet werden müßten, tragen zur Fortentwicklung einer empirischen Sprachtheorie nichts bei.

### **4 Zusammenfassung**

Der intuitive Begriff 'Normalbetonung' läßt sich unter Rückgriff auf den Begriff 'Fokus' adäquat explizieren: Ein Satz S*<sup>i</sup>* hat stilistisch normale Betonung gdw. er unter allen Sätzen, die sich von S*<sup>i</sup>* nur hinsichtlich der Konstituentenbetonung unterscheiden, die meisten möglichen Foki hat.

<sup>37</sup>Tatsächlich ist das schon deshalb nicht der Fall, weil typologische Untersuchungen in dem hier interessierenden Bereich in hohem Maße Annahmen darüber zu machen pflegen, was in den Einzelsprachen jeweils 'normal' bzw. 'markiert' ist, – Annahmen, deren Basis und Relevanz häufig nicht klar ist.

Unabhängig davon sind die grundsätzlichen Probleme, nach welchen Kriterien gegebene sprachliche Erscheinungen als typologisch normal oder markiert zu beurteilen sind, wohlbekannt.

Drei Dinge sind dabei wesentlich: (1) Insofern nicht von aktuellen Foki (in einem gegebenen Kontext), sondern von möglichen Foki die Rede ist, basiert diese Explikation auf einem satzgrammatischen Konzept (und nicht auf der Betrachtung von Äußerungen). (2) Indem diese Explikation auf dem Fokusbegriff aufbaut, basiert sie zugleich auf dem Begriff 'möglicher Kontexttyp', d. h. auf einem essentiell pragmatischen Begriff. 'Normalbetonung' ist damit ein inhärent pragmatisches Konzept. (3) Durch eben diesen Rückgriff auf pragmatische Zusammenhänge hat die vorgeschlagene Explikation erklärenden Charakter: Eine Betonung, die die relativ meisten möglichen Foki zuläßt, ist 'normal', weil sie kontextuell am wenigsten restringiert ist.

Diese Explikation ist in vielfältiger Weise fruchtbar; u. a. erklärt sie die Eigenschaften von Sätzen wie

(65) John called Bill a Republican, and then *he* insulted *him*.

Darauf aufbauend läßt sich der Begriff 'stilistisch normale Wortstellung' explizieren: Ein Satz S*<sup>i</sup>* weist 'stilistisch normale Wortstellung' auf gdw. er unter allen Sätzen, die sich von S*<sup>i</sup>* nur hinsichtlich der Wortstellung und/oder der Betonung unterscheiden, bei geeigneter Betonung die meisten möglichen Foki hat, d. h. in den meisten Kontexttypen vorkommen kann. Diese Explikation erweist sich wiederum als explanatorisch adäquat: Ein Satz mit einer solchen Wortstellung ist 'normal', *weil* er so etwas wie ein Universalinstrument darstellt, indem diese Wortstellung kontextuell minimal restringiert ist.

Diese Explikation erklärt u. a., wieso bei 2-deutigen Sätzen wie

(163) a. die Frau hat ein Mädchen gebissen

die Interpretation mit *Mädchen* als Objekt intuitiv leichter zugänglich ist als die andere.

Im Unterschied dazu haben wir eine Definition von 'strukturell normaler Wortstellung' betrachtet und gefunden, daß sie (a) sich tiefgehend von der Explikation von 'stilistisch normaler' Wortstellung unterscheidet, (b) in hohem Maß willkürliche Anwendungen erlaubt und (c) von äußerst fraglicher Relevanz ist.

### **Literatur**

Abraham, Werner. 1977. Komplexe Nominalgruppen im Deutschen: Thema-Rhemaverteilung und das Squish-Prinzip. *Zeitschrift für Germanistische Linguistik* 5. 145–180.

3 Explikationen für "normale Betonung" und "normale Wortstellung"


Bean, Marian C. 1978. Review of Schmerling (1976). *Language* 54. 955–958.


3 Explikationen für "normale Betonung" und "normale Wortstellung"


*tone, stress, and intonation*, 144–173. Washington D.C.: Georgetown University Press.


### **Chapter 4**

## **Subjektlücken in Koordinationen**

### Tilman N. Höhle

Im Deutschen muß man topologisch 3 verschiedene Satztypen unterscheiden, die die (vereinfachten) Schemata in (1) erfüllen:


" *K*", " *KM*" und " *KN*" repräsentieren Konstituenten beliebiger Art; " C" steht für Konjunktionen (*daß*, *ob* usw.) und konjunktional gebrauchte Konstituenten (die ein Interrogativpronomen o. ä. enthalten); " VZ" bezeichnet Konverben ('Verbzusätze', 'trennbare Verbalpräfixe') wie *auf* in *aufhören* und *an* in *anfangen*. " V" steht für Verben beliebiger Art in beliebiger Flexionsform (finit oder infinit); wenn " V\*" durch eine Kette von Verben realisiert ist, bilden diese das Schlußfeld eines Kohärenzfelds im Sinne von Bech (1955: 60). Die Position FIN wird durch ein lexikalisches Element ausgefüllt, das die Finitheitskategorien (Person (2./ 1./3.), Numerus (Singular/Plural), Modus (Indikativ/Konjunktiv/Imperativ), morphologisches 'Tempus' (Präsens/Präteritum)) realisiert; das ist im Deutschen ein finites Verb. F1- und F2-Sätze fasse ich als " F-Sätze" zusammen. (" <sup>F</sup>" soll an " FIN" und an " frontal" erinnern.)

Ich möchte ein Phänomen bei Koordinationen in F-Sätzen besprechen: die SLF-Koordination (Abschnitt 3). Es ist keine theoretische Interpretation dieses Phänomens bekannt. Eine adäquate Interpretation hat auf jeden Fall Implikationen für

<sup>§</sup>*Anmerkung der Herausgeber:* Diese hier erstmals veröffentlichte Arbeit (fertiggestellt April 1983, Universität Köln) fand als " graues Papier" – in 2 textidentischen, aber nach Layout und Paginierung unterschiedlichen Versionen – weite Verbreitung. Editorische Eingriffe in den vorliegenden Abdruck beschränken sich auf Anpassungen an das einheitliche Bandformat. Zum Bezug dieser Arbeit zu *Topologische Felder* (ebenfalls 1983 entstanden) vgl. die Herausgeber-Anmerkung zu letzterer Arbeit (in diesem Band, S. 4).

Tilman N. Höhle. 2019. Subjektlücken in Koordinationen. In Stefan Müller, Marga Reis & Frank Richter (Hrsg.), *Beiträge zur deutschen Grammatik. Gesammelte Schriften von Tilman N. Höhle. Zweite durchgesehene Auflage*, 193–218. Berlin: Language Science Press. DOI:10.5281/zenodo.2588353

die Theorie der Koordination; möglicherweise außerdem für die Theorie der F-Sätze und deren hierarchische Strukturierung. (Gewisse Aspekte von SLF-Koordinationen werden bei Kunze (1972: 61–67, 94f, 98f) und bei Hankamer (1973: 28f) besprochen; bei Behaghel (1928: §1192b) gibt es einige Beispiele. Ansonsten ist das Phänomen offenbar unbeachtet geblieben, besonders bei Kohrt (1976), Neijt (1979), Hankamer (1979).) Damit die Eigenarten der SLF-Koordination hervortreten, muß man kurz die normalen Koordinationsphänomene betrachten (Abschnitte 1 und 2).

### **1 Typen von Koordinationen**

Die Koordination von (uneingebetteten) vollständigen Sätzen ist syntaktisch weitgehend uninteressant. Von syntaktischem Interesse sind Koordinationen dann, wenn die koordinierten Satzbestandteile <sup>1</sup>*B*, …, *<sup>n</sup>B* einen gemeinsamen Bezug zu einem Satzbestandteil *A* haben. Man kann zunächst 3 Typen unterscheiden: Gapping, Linkstilgung und phrasale Koordination.

**1.1** Bei Gapping wie in (2) ist (mindestens) ein Verb im ersten Konjunkt gemeinsamer Bestandteil:

	- b. ich glaube, daß Karl den Kater füttert und Heinz den Hund \_\_\_

Hier sind sowohl *Karl* als auch *Heinz* Subjekt zu *füttert*, und sowohl *den Kater* als auch *den Hund* sind Objekt zu *füttert*.

**1.2** Bei Linkstilgungen wie in (3) ist eine Kette von Konstituenten am Ende des letzten Konjunkts gemeinsamer Bestandteil:

	- b. ich glaube, daß Karl für die große \_\_\_ und sie glaubt, daß er für die kleine Lösung eintritt

Hier sind sowohl *große* als auch *kleine* Attribut zu *Lösung*; in (3a) gehört das Konverb *ein* sowohl zu dem ersten als auch zu dem zweiten *tritt*; in (3b) sind sowohl *Karl* als auch *er* Subjekt zu dem idiomatischen Konverb-Verb-Komplex *eintritt*.

### 4 Subjektlücken in Koordinationen

**1.3** Als phrasale Koordination bezeichne ich den Fall, daß koordinierte Satzbestandteile <sup>1</sup>*B*, …, *<sup>n</sup>B* einen gemeinsamen grammatischen Bezug zu einer Konstituente *A* desselben Gesamtsatzes haben und (4) gilt:

(4) a. <sup>1</sup>*B*, …, *<sup>n</sup>B* sind

	- i. *<sup>j</sup>B* eine freie Spur *<sup>j</sup>* t enthält und
	- ii. *<sup>i</sup>* t und *<sup>j</sup>* t von derselben Konstituente *D* unmittelbar gebunden werden.

" Kongruent" in (4aii) bezeichnet ein intuitives und explikationsbedürftiges Konzept: Die Konjunkte müssen in gewisser Weise übereinstimmen. Ich will hier annehmen, daß aus einer adäquaten Explikation folgt, daß auf jeden Fall Anzahl, Kategorie und Reihenfolge der unmittelbaren Konstituenten von *<sup>j</sup>B* in allen Konjunkten übereinstimmen, und wir werden einige Implikationen dieser Annahme verfolgen. Wegen (4aiii) fällt Gapping wie in (2a) nicht unter phrasale Koordination. Aus (4a) folgt, daß *A* nicht in *B* enthalten ist.

Die Bedingung (4b) subsumiert den CSC (Coordinate Structure Constraint) und einen wesentlichen Aspekt der ATB-Phänomene (across-the-board rule application) von Ross (1967: §4.2). Wenn ein Satzbestandteil *X* eine 'freie Spur' enthält, ist die Spur nicht in *<sup>X</sup>* gebunden. Die Qualifikation " unmittelbar (gebunden)" soll mittelbare Bindung wie bei Parasitic Gaps ausschließen. Aus (4b) folgt, daß *D* nicht in *B* enthalten ist. *D* kann mit *A* identisch sein. Linkstilgungen wie in (3) können nur dann unter phrasale Koordination fallen, wenn man sie als (Right Node) Raising mit Spuren analysiert. Dafür gibt es im Deutschen keinen Anhaltspunkt; ich gehe davon aus, daß der gemeinsame Bestandteil bei Linkstilgungen Teil des letzten Konjunkts ist.

Wenn man die durch Klammern angedeuteten Konstituentenstrukturen annimmt (die plausibel, aber nicht selbstverständlich sind), kann man E-Sätze wie (5) und F2-Sätze wie (6) als phrasale Koordinationen analysieren:

	- b. ich glaube, daß [sowohl [Heinz schläft] als auch [Karl döst]]
	- c. Karl glaubt, daß ihn [[jeder liebt] und [keiner haßt]]

	- b. damals hat [sowohl [Heinz seiner Tante die Briefmarken gezeigt] als auch [Karl seinem Onkel die Puppen verkauft]]
	- c. damals hat Heinz seiner Tante [[die Briefmarken gezeigt] und [die Puppen verkauft]]

Phrasale Koordination und Linkstilgung können kombiniert auftreten:

(7) ich glaube, daß ihn [[Heinz seiner Tante \_\_\_ ] und [Karl seinem Onkel zeigt]]

Für (4aii) zählt die Lücke in (7) offenbar als gefüllt. Ebenso bei Gapping:

(8) ich glaube, daß Heinz [[die Briefmarken seiner Tante zeigt] und [die Puppen seinem Onkel \_\_\_ ]]

**1.4** Man muß mindestens für expositorische Zwecke neben Gapping, Linkstilgung und phrasaler Koordination einen vierten Typ unterscheiden: gespaltene Konjunkte wie in (9):

	- b. seine Tante hat den Hund gefüttert oder den Kater
	- c. den Hund gefüttert hat seine Tante oder den Ochsen getränkt

Es könnte sein, daß diese nachgestellten koordinierten Konstituenten die Reste von Sätzen sind, die durch Gapping reduziert sind. Diese Annahme hat Vorzüge. (i) Da bei Gapping auf jeden Fall das unabhängige (im Allgemeinen also das finite) Verb getilgt wird, ist es klar, warum (10) unmöglich ist (Neijt 1979: 64):

	- b. \* seine Tante will den Hund füttern oder soll

(ii) Da Gapping – im Gegensatz zur Linkstilgung – nicht über adverbiale Konjunktionen hinweg möglich ist (vgl. (11)), ist klar, warum (12) unmöglich ist:

	- b. \* Karl ging weg, weil seine Tante den Hund fütterte oder obwohl sein Onkel den Kater \_\_\_

4 Subjektlücken in Koordinationen

	- b. \* Karl ging weg, weil seine Tante den Hund fütterte oder obwohl

Gegen diese Annahme spricht, daß es gespaltene Konjunkte wie in (13) gibt, zu denen weder parallele volle Sätze (14) noch klare Gapping-Parallelen (15) existieren:

	- b. sowohl Karl liebt den Hund als auch Heinz
	- b. i. \* sowohl Karl liebt den Hund als auch Heinz liebt den Hund
		- ii. \* sowohl Karl liebt den Hund als auch Heinz liebt den Kater
	- b. \* sowohl Karl liebt den Hund als auch Heinz den Kater

Falls gespaltene Konjunkte nicht auf Gapping zurückgehen, ist es möglich, daß Beispiele wie (16) syntaktisch 2-deutig sind: *den Hund füttert oder den Ochsen tränkt* kann eine Konstituente sein, dann liegt phrasale Koordination vor; oder *oder den Ochsen tränkt* könnte ein nachgestelltes gespaltenes Konjunkt sein:

(16) ich glaube, daß meine Tante den Hund füttert oder den Ochsen tränkt

### **2 Phrasale Koordination**

Bei Koordinationen in F-Sätzen herrschen strenge Gesetzmäßigkeiten. Für Sätze der Form (17), wo *<sup>X</sup>* und *<sup>Y</sup>* Ketten sind und " &" eine koordinierende Konjunktion repräsentiert, gilt, wie es scheint, (18):


(Gapping kommt hier aus erwähnten Gründen nicht in Frage; ebensowenig gespaltene Konjunkte.)

Im einzelnen. (i) Wenn weder <sup>1</sup>*K* noch <sup>2</sup>*K* vorhanden ist – also ein F1-Satz vorliegt –, ist ausschließlich Linkstilgung möglich, da bei vorhandenem <sup>1</sup> FIN und

2 FIN kein Teil von *X* mit einem Teil von *Y* eine Konstituente bildet, wie es für phrasale Koordination nötig wäre; vgl. (19) gegenüber (20):

	- b. zeigt Karl \_\_\_ oder verkauft Heinz die Puppen dem Onkel?
	- b. \* zeigt Karl \_\_\_ der Tante oder verkauft Heinz die Puppen dem Onkel?

(ii) Wenn sowohl <sup>1</sup>*K* als auch <sup>2</sup>*K* vorhanden ist, ist aus entsprechenden Gründen ebenfalls nur Linkstilgung möglich; vgl. (21) gegenüber (22):

	- b. morgen zeigt Karl \_\_\_ und übermorgen zeigt Heinz dem Onkel die Briefmarken
	- c. morgen zeigt \_\_\_ und übermorgen verkauft Heinz dem Onkel die Briefmarken
	- b. \* morgen zeigt Karl der Tante die Briefmarken, und übermorgen zeigt Heinz \_\_\_
	- c. \* morgen zeigt \_\_\_ der Tante die Briefmarken, und übermorgen verkauft Karl dem Onkel die Puppen

(iii) Ich betrachte nur Fälle, in denen die Koordination semantisch einheitlich ist, also z. B. nicht Koordinationen von Imperativsatz und Deklarativsatz wie (23):

(23) zeig ihm eine Briefmarke, und er zeigt dir (seinerseits) eine Briefmarke

(Hier ist auch Linkstilgung nicht möglich; wir gehen darauf nicht weiter ein.) Unter dieser Voraussetzung ist (17) mit vorhandenem <sup>2</sup>*K* nicht möglich, wenn kein <sup>1</sup>*K* vorhanden ist. (iv) Wenn <sup>1</sup>*K*, aber nicht <sup>2</sup>*K* vorhanden ist, muß phrasale Koordination vorliegen, wobei <sup>1</sup>*K* eine gemeinsame Konstituente ist. Soweit es weitere gemeinsame Konstituenten gibt, müssen sie auf Linkstilgung zurückgehen.

Die Beispiele in (24) sind einwandfrei, da sie als phrasale Koordination analysiert werden können:

4 Subjektlücken in Koordinationen

	- b. der Tante<sup>i</sup> [[zeigt Karl (t<sup>i</sup> ) die Briefmarken] und [verkauft Heinz (t<sup>i</sup> ) die Puppen]]
	- c. die Briefmarken<sup>i</sup> [[zeigt Karl der Tante (t<sup>i</sup> )] und [verkauft Heinz dem Onkel (t<sup>i</sup> )]]

Dies ist deshalb möglich, weil (i) die beiden Konjunkte kongruent sind, (ii) zusammen eine Konstituente bilden und (iii) einen gemeinsamen Bezug zu der Konstituente in der *K*-Position haben; und wenn es Gründe gibt, diese erste Konstituente an eine freie Spur in einem der Konjunkte zu binden, sprechen dieselben Gründe dafür, sie an eine eben solche freie Spur in allen Konjunkten (unmittelbar) zu binden. (18) ist hier erfüllt.

Die Beispiele in (25) sind vermutlich deshalb unmöglich, weil sie (18) nicht erfüllen:

	- b. \* der Tante soll Karl die Briefmarken zeigen und muß Heinz dem Onkel die Puppen verkaufen

Intuitiv ist klar, daß *der Tante* (i) hier Objekt zu *zeigt* bzw. *zeigen* ist, aber nicht zu *verkauft* bzw *verkaufen*, (ii) bei dieser Satzstruktur aber Objekt zu beiden Verben sein müßte. Dieser Intuition kann man dadurch Rechnung tragen, daß man dort, wo in vergleichbaren Sätzen wie (24a) ein Dativobjekt stehen würde, eine Spur einsetzt, an die *der Tante* gebunden ist:

	- b. der Tante<sup>i</sup> [[soll Karl t<sup>i</sup> die Briefmarken zeigen] und [muß Heinz t<sup>i</sup> dem Onkel die Puppen verkaufen]]

(Für die Annahme, daß Konstituenten in *K* an Spuren nach der FIN-Position gebunden sein müssen, gibt es unabhängige Gründe.) Wenn diese Strukturierungen alle Bedingungen von (4) erfüllen, verletzen sie doch durch die Spur im letzten Konjunkt die Kookkurrenzrestriktionen von *verkauf-*. Dies entspricht der Intuition; aber es ist offen, wodurch die Einsetzung der Spur erzwungen wird. Ich will hier ein Prinzip wie (27) annehmen:

(27) Wenn zwei Konjunkte *<sup>i</sup>B* und *<sup>j</sup>B* kongruent sind, müssen sie (4b) erfüllen.

Wir können annehmen, daß *zeigt Karl t<sup>i</sup> die Briefmarken* und *verkauft Heinz dem Onkel die Puppen* kongruent sind. Unter dieser Annahme verlangt (27) eine Spur im zweiten Konjunkt; wenn die Spur nicht eingesetzt wird, ist (27) verletzt.

Genau das gleiche gilt dann für Beispiele wie (28a) mit der Struktur (28b):

	- b. dem Onkel<sup>i</sup> [[zeigt Karl (t<sup>i</sup> ) der Tante die Briefmarken] und [verkauft Heinz t<sup>i</sup> die Puppen]]

Vergleichen wir (29a) mit (30):

	- b. den Ochsen<sup>i</sup> [[füttert Karl ti] und [tränkt Heinz ti]]
	- b. \* den Ochsen füttert Karl und schläft Heinz

Mit der Strukturierung (29b) erfüllt (29a) die Bedingungen von (4) und die Kookkurrenzrestriktionen der Prädikate. Die naheliegende Strukturierung für (30a) ist (31) (entsprechend für (30b)):

(31) den Ochsen<sup>i</sup> [[schläft Heinz] und [füttert Karl ti]]

Hier enthält das Konjunkt *füttert Karl t<sup>i</sup>* eine freie Spur, die im anderen Konjunkt keine Entsprechung hat (oder eine dort vorhandene Spur verletzt die Restriktionen des Verbs). (27) wird dadurch aber nur dann verletzt, wenn die Konjunkte kongruent sind. Wenn die Konstituente 3 unmittelbare Konstituenten hat, hat die Konstituente *schläft Heinz* nur 2 unmittelbare Konstituenten. Die beiden Konjunkte sind dann nicht kongruent, und (27) kommt nicht zur Wirkung. Wir haben jedoch bei (5b) und (6b) angenommen, daß die Satzabschnitte nach der Konjunktion bzw nach der FIN-Position eine Konstituente bilden; dementsprechend müßte (30a) die Strukturierung (32) erhalten:

(32) den Ochsen<sup>i</sup> [[schläft [Heinz]] und [füttert [Karl ti]]]

Hier haben die Konjunkte die gleiche Anzahl von unmittelbaren Konstituenten. Ob *Heinz* und *Karl t<sup>i</sup>* dieselbe Kategorie haben, ist nicht unmittelbar klar. Wenn nicht, sind sie nicht kongruent. Dagegen spricht jedoch (33):

4 Subjektlücken in Koordinationen

	- b. Karl schläft oder füttert den Ochsen

Die FIN-Positionen, in denen *stimmte* und *nickte* in (33a) bzw *schläft* und *füttert* in (33b) sich befinden, sind in systematischer Hinsicht keine Verbpositionen; schon deshalb ist es nicht möglich, *stimmte zu* bzw *füttert den Ochsen* als eine Projektion von V anzusehen, die mit einer gleichartigen V-Projektion koordiniert sein könnte, in der *nickte* bzw *schläft* enthalten wäre; dies gilt erst recht, wenn *Karl* jeweils an Spuren gebunden ist. Nach unseren Annahmen müssen die Sätze die Struktur (34) haben:

(34) a. Karl<sup>i</sup> [[stimmte [t<sup>i</sup> zu]] und [nickte [ti]]] b. Karl<sup>i</sup> [[schläft [ti]] oder [füttert [t<sup>i</sup> den Ochsen]]]

Da dies vermutlich eine phrasale Koordination ist, müssen die Konstituenten *t<sup>i</sup> zu* und *t<sup>i</sup>* im letzten Konjunkt von (33a) bzw *t<sup>i</sup>* im ersten Konjunkt von (34b) und *t<sup>i</sup> den Ochsen* die gleiche Kategorie haben; ich nenne sie willkürlich O. Dann ist anzunehmen, daß auch *Heinz* und *Karl t<sup>i</sup>* in (32) Konstituenten von der Kategorie O sind. Unter dieser Voraussetzung sind die Konjunkte kongruent, so daß (27) verletzt ist.

Nach diesen Überlegungen haben die Sätze in (35) die Struktur (36):


Die adverbialen Ausdrücke in den *K*-Positionen von (37) müssen, wie aufgrund unserer Annahmen über Konstituentenstrukturen zu erwarten ist, jeweils als gemeinsame Konstituenten für beide Konjunkte interpretiert werden:

	- b. in Mainz fährt Karl am Abend los und kommt Heinz am Morgen an
	- c. in Köln wohnen ein paar Mafiahäuptlinge und beherrscht ein sizilianischer Clan den gesamten Großhandel

Daß dies eine grammatische Notwendigkeit und keine rein pragmatische (diskursähnliche) Erscheinung ist, zeigt sich an (38):

	- b. \* in Mainz fährt Karl am Abend los und kommt Heinz am Morgen in Bonn an
	- c. \* in Köln wohnen ein paar Mafiahäuptlinge und beherrscht ein sizilianischer Clan von dort aus den gesamten Großhandel

In (38a) ist *am Morgen* mit der Angabe *bis zum Abend* im zweiten Konjunkt nicht kompatibel; in (38b) ist *in Mainz* mit *in Bonn* nicht kompatibel; in (38c) ist *in Köln* mit *von dort aus* nicht kompatibel; vgl. (39):

(39) \* in Köln beherrscht ein sizilianischer Clan von dort aus den gesamten Großhandel

Entsprechende Diskurse sind dagegen einwandfrei.

### **3 SLF-Koordination**

	- b. wann hat jemand einen Einfall und sagt uns die Lösung?
	- c. stehen da schon wieder welche rum und verteilen Flugblätter?
	- d. nimmt man den Deckel ab und rührt die Füllung um, steigen übelriechende Dämpfe auf
	- e. gehen Sie lieber nach Hause und bringen Ihre Angelegenheiten in Ordnung!

Wir haben hier F-Sätze: (40a) ist ein deklarativer und (40b) ein interrogativer F2-Satz; (40c) ist ein interrogativer, (40d) ein konditionaler und (40e) ein imperativischer F1-Satz. Das charakterisierende Kennzeichen ist, daß das Subjekt des ersten Konjunkts zugleich als Subjekt des letzten Konjunkts fungiert. Beispiele dieses Typs erfüllen das Schema (41):

(41) (*K*) FIN <sup>1</sup>*X* SU <sup>2</sup>*X* & FIN <sup>1</sup>*Y SL* <sup>2</sup>*Y*

Dabei steht " SU" für das Subjekt und " *SL*" für eine Subjektlücke. Dieses Symbol soll theoretisch neutral sein und nur zum Ausdruck bringen, daß im zweiten Konjunkt ein (mit der Realisierung von SU identisches) Subjekt impliziert, aber nicht

### 4 Subjektlücken in Koordinationen

ausgedrückt ist. Ob dem Symbol syntaktisch eine Konstituente (etwa eine Spur oder ein PRO-Element) oder gar nichts entspricht, lasse ich vorläufig offen. In jedem Fall haben die beiden Konjunkte einen gemeinsamen grammatischen Bezug zu SU, ohne daß die Bedingungen von (18) erfüllt sind. Sätze, die das Schema (41) erfüllen, nenne ich SLF-Koordinationen.

**3.2** Als Realisierungen von *&* finden sich außer *und* auch *oder*, *aber* und *sondern*:

	- b. da standen ein paar Leute rum, rührten aber keinen Finger
	- c. ist Karl etwa nicht zur Arbeit gegangen, sondern hat sich ins Bett gelegt?

Die Stellung des *aber* nach dem finiten Verb in (42b) weicht von der Stellung der anderen koordinierenden Partikeln ab; die erwartete Stellung vor dem Verb ist ausgeschlossen:

(43) \* da standen ein paar Leute rum, aber rührten keinen Finger

Dies ist unerklärt, findet sich aber auch in anderen Fällen, z. B. bei phrasaler Koordination wie in (44):

	- b. \* ein paar Leute standen da rum, aber rührten keinen Finger

Die Doppelkonjunktionen *weder – noch* und *sowohl – als auch* finden sich – anders als bei gespaltenen Konjunkten, vgl. (13) – weder bei SLF-Koordinationen (45) noch bei phrasaler Koordination wie in (46):

	- b. \* morgen tränkt Karl sowohl den Ochsen als auch füttert den Hund
	- b. \* Karl tränkt sowohl den Ochsen als auch füttert den Hund

Bei *weder – noch* ist zwar mit *weder* in der *K*-Position eine Koordination vollständiger F2-Sätze möglich wie in (47a); dazu gibt es jedoch keine SLF-Parallele (47b):

	- b. \* weder tränkt Karl den Ochsen noch füttert den Hund

**3.3** Bei SLF-Koordinationen kann im letzten Konjunkt keine Konstituente (außer dem Subjekt) ausgelassen werden:

	- b. \* morgen zeigt Karl dem Onkel die Briefmarken und bietet *SL* ihm zum Verkauf an
	- c. \* morgen zeigt Karl dem Onkel die Briefmarken und bietet *SL* zum Verkauf an

In (48a) ist eine normale SLF-Koordination. Sobald außer dem Subjekt noch eine (48b) oder mehrere (48c) Konstituenten ausgelassen werden, sind die Beispiele unakzeptabel. Dies dürfte daran liegen, daß Gapping und Linkstilgung die einzigen existierenden Tilgungsoperationen sind. (Falls in SLF-Koordinationen das Subjekt infolge einer Tilgungsoperation fehlt, müßte dies jedenfalls eine speziell für diesen Fall zugeschnittene Regel sein.)

Auch wenn die auszulassende Konstituente in der *K*-Position steht, ergeben sich keine akzeptablen Beispiele:

(49) \* die Briefmarken zeigt Karl dem Onkel und bietet *SL* zum Verkauf an

Mit *die Briefmarken* in der *K*-Position gibt es nur zwei Möglichkeiten: Entweder eine SLF-Koordination mit Objektpronomen wie in (50a), oder phrasale Koordination (mit einem Subjekt im letzten Konjunkt) wie in (50b):

	- b. die Briefmarken zeigt Karl dem Onkel und bietet er ihm zum Verkauf an

Die phrasale Koordination in (50b) entspricht den Erwartungen; die Einsetzung eines Akkusativobjekts im letzten Konjunkt (auch eines anaphorischen *sie*) ist völlig unmöglich; vgl. (25). Aber (50a) ist – wie auch (49) – sehr bemerkenswert. Wenn die beiden Teilketten *zeigt Karl dem Onkel* und *bietet SL ihm zum Verkauf an* (i) kongruent wären und (ii) gemeinsam eine Konstituente bilden würden, wären (27) und (4a) erfüllt. Unter dieser Voraussetzung müßte (49) möglich und (50a) unmöglich sein; tatsächlich ist es genau umgekehrt. Das Verhältnis von (51) zu (52) ist von gleicher Art:

4 Subjektlücken in Koordinationen

	- b. die Fibeltexte versteht er und kann *SL* \*(sie) mit etwas Übung flüssig lesen
	- c. solchen Leuten stellt man keinen Scheck aus, sondern gibt *SL* \*(ihnen) einen Gutschein
	- b. die Fibeltexte versteht er (\*sie) und kann er (\*sie) mit etwas Übung flüssig lesen
	- c. solchen Leuten stellt man (\*ihnen) keinen Scheck aus, sondern gibt man (\*ihnen) einen Gutschein

In (51) ist jeweils eine SLF-Koordination, bei der die Auslassung der Anapher im letzten Konjunkt unmöglich ist; in (52) ist jeweils eine phrasale Koordination, bei der keine Anapher der Konstituente in der *K*-Position auftreten kann. (Konstruktionen wie (52) sind nicht immer gut und in gewissen Fällen unmöglich. Wir kommen in Abschnitt 3.6 darauf zurück. Es scheint auch für Konstruktionen wie (51) Beschränkungen zu geben; darauf gehen wir nicht ein.)

SLF-Koordinationen können offenbar nicht die Bedingungen für phrasale Koordination erfüllen. Das könnte daran liegen, daß die beiden Teilketten " FIN <sup>1</sup>*X* SU <sup>2</sup>*X*" und " FIN <sup>1</sup>*Y SL* <sup>2</sup>*Y*" in (41) nicht gemeinsam eine Konstituente bilden; dann ist (4aiii) nicht erfüllt. Man könnte erwarten, durch Extrapositionsphänomene darüber Aufschluß zu erhalten. Extraponierte Sätze stehen in einer *KN*-Position (vgl. (1)). Bei SLF-Koordinationen gibt es für extraponierte Sätze, die zum Subjekt gehören, zwei Möglichkeiten:

	- b. gestern ist jemand gekommen, den ich noch nie gesehen hatte, und hat die Sachen abgeholt
	- c. gestern ist jemand gekommen und hat die Sachen abgeholt, den ich noch nie gesehen hatte

In (53a) ist der Relativsatz, der sich auf *jemand* bezieht, Teil derselben Nominalphrase wie sein Bezugswort; in (53b) ist er ans Ende des ersten Konjunkts extraponiert, in (53c) ans Ende des ganzen Satzes. Dieselben Möglichkeiten bestehen bei phrasaler Koordination:

	- b. ein Kerl ist gestern gekommen, den ich noch nie gesehen hatte, und hat die Sachen abgeholt
	- c. ein Kerl ist gestern gekommen und hat die Sachen abgeholt, den ich noch nie gesehen hatte

Bei gespaltenen Konjunkten (die (4aiii) mit Sicherheit nicht erfüllen) ergeben sich jedoch dieselben Möglichkeiten:

	- b. gestern hat jemand das Radio abgeholt, den ich noch nie gesehen hatte, und die Standuhr
	- c. gestern hat jemand das Radio abgeholt und die Standuhr, den ich noch nie gesehen hatte

(Die zweite Extrapositionsmöglichkeit besteht weder bei SLF- oder phrasaler Koordination noch bei gespaltenen Konjunkten, wenn sich der extraponierte Satz auf ein Objekt bezieht.)

Unabhängig davon, ob in SLF-Koordinationen (4aiii) erfüllt ist, besteht ein wesentliches Problem: Wenn (27) korrekt ist, müßte das letzte Konjunkt die Bedingung (4b) erfüllen. Da das erste Konjunkt eine Spur enthält, an die die Konstituente in der *K*-Position gebunden ist, müßte das zweite Konjunkt eine ebensolche Spur enthalten; dies ist aber grade nicht der Fall. Dieses Problem ist gelöst, wenn die beiden Konjunkte nicht kongruent sind. Das könnte daraus resultieren, daß (i) zur Erfüllung der Kongruenzbedingung in F-Sätzen auch Übereinstimmung in den unmittelbaren Konstituenten der O-Konstituente herrschen muß und (ii) *SL* keine syntaktische Realisierung hat. (Diese zweite Annahme ist plausibel: Wenn *SL* eine Spur oder ein PRO-Element wäre, würde *SL* völlig ungewöhnlichen Bedingungen unterliegen. Die erste Annahme ist nur erfolgreich, wenn man die Existenz einer Verbalphrase annimmt, die dann, wenn in einem F-Satz kein infinites Verb enthalten ist, ein leeres Verb enthalten müßte, z. B. in (19), (21), (24), (33), (35).) Aus dieser Annahme folgt, daß in (51) eine Anapher an einer Stelle stehen kann, wo in (52) eine Spur stehen muß. Warum die Anapher obligatorisch ist, werden wir in Abschnitt 3.5 sehen.

Da bei SLF-Koordinationen der Spur im ersten Konjunkt keine Spur im letzten Konjunkt entsprechen muß, sind u. a. auch Komplexe mit infiniten Verben in der *K*-Position möglich:

4 Subjektlücken in Koordinationen

(56) hergekommen sind sie und haben (\*sie) uns die Hühner weggenommen

Und wenn das letzte Konjunkt ein Prädikat enthält, das keine Konstituente zuläßt, die der Konstituente in der *K*-Position entspricht, ergeben sich erwartungsgemäß Beispiele wie (57):

	- b. das Gepäck ließ er fallen und rannte zum Hinterausgang
	- c. um die Toten kümmert er sich vorbildlich, vernachlässigt aber die Verletzten
	- d. diesem Vorschlag ist die Kommission gefolgt und hat eine neue Unterkommission eingesetzt

(Bei phrasaler Koordination ist dergleichen unmöglich; vgl. (30b).)<sup>1</sup>

Zu solchen Beispielen gibt es jedoch keine Interrogativsatz-Parallelen. Beispiele wie (58) sind – im Gegensatz zu solchen wie (40b) – unakzeptabel:

	- b. \* was ließ er fallen und rannte zum Hinterausgang?
	- c. \* welchem Vorschlag ist die Kommission gefolgt und hat eine neue Unterkommission eingesetzt?

Es scheint, daß unabhängig von den Bedingungen für phrasale Koordination in Interrogativsätzen die Restriktion gilt, daß die interrogative Konstituente in gewisser Weise mit allen Prädikaten des Satzes verknüpft sein muß. Es ist nicht klar, wie das präzise zu formulieren ist und worauf es eventuell zurückgeführt werden kann. Wenn die Beobachtung korrekt ist, bedeutet sie jedoch, daß die strukturellen ATB-Phänomene nicht anhand von Interrogativsätzen untersucht werden können.

In interrogativen Parallelen zu (51) ist es – so wie in (51) selbst – erwartungsgemäß ganz unmöglich, eine Objektanapher auszulassen:

	- b. was für Texte versteht er und kann *SL* \*(sie) mit etwas Übung flüssig lesen?
	- c. was für Leuten stellt man keine Schecks aus, sondern gibt *SL* \*(ihnen) einen Gutschein?

Hier ist allerdings die phrasale Koordination wie in (52) stark bevorzugt.

<sup>1</sup>Anm. der Herausgeber: Dieser Satz findet sich nur in einer der uns vorliegenden 'grauen' Versionen der vorliegenden Arbeit.

**3.4** Für Linkstilgungen scheint eine sehr strenge Parallelitätsbedingung zu gelten (die stärker ist als die Kongruenzbedingung von (4aii)):

	- b. \* Karl erblickte und Heinz zeigte der Tante etwas ganz Besonderes
	- c. \* Karl zeigte der Tante und Heinz erblickte etwas ganz Besonderes

Hinsichtlich der Anzahl, der Kategorie und der Einbettungsverhältnisse der ausgelassenen Konstituenten herrscht bei Linkstilgungen außerordentlich große Freiheit, aber wenn eine auszulassende Konstituente Teil einer nicht-parallelen Struktur ist wie in (60b) und (60c), ist die Auslassung schlecht oder unmöglich. Auch in SLF-Koordinationen sind Linkstilgungen schlecht (61); entsprechende Linkstilgungen in anderen Koordinationen sind dagegen einwandfrei (62):

	- b. \* hoffentlich sieht keiner \_\_\_ und klaut *SL* die Sachen
	- c. \* vertreibt die Firma \_\_\_ oder produziert *SL* Kühlschränke?
	- d. \* offerieren wir dem Onkel \_\_\_ und verkaufen *SL* der Tante doch ein paar Briefmarken!
	- b. vertreibt die Firma \_\_\_ oder produziert sie Kühlschränke?
	- c. offerieren wir dem Onkel \_\_\_ und verkaufen wir der Tante doch ein paar Briefmarken!

Wenn die Konjunkte bei SLF-Koordinationen nicht kongruent sind, genügen sie vermutlich auch nicht der strengen Parallelitätsbedingung. Die Unakzeptabilität von (61) folgt also möglicherweise aus der Annahme, daß *SL* keine syntaktische Realisation hat.

**3.5** Aus diesen Annahmen folgt, daß Beispiele wie (51) und (57) möglich sind. Aus ihnen folgt nicht, daß Beispiele wie (63) unmöglich sind:

	- b. \* das Gepäck rannte er zum Hinterausgang und ließ *SL* fallen

Die vergleichbaren Beispiele (28a) und (30a) haben wir auf eine Verletzung von (27) zurückgeführt; das ist hier nicht möglich. Nach unseren Annahmen sollte (63) ebenso gut möglich sein wie (51) und (57).

Möglicherweise kann man ein allgemeines Prinzip wie (64) annehmen:

4 Subjektlücken in Koordinationen

	- i. die beiden Konjunkte kongruent sind und
	- ii. das erste Konjunkt eine freie Spur enthält.
	- b. Die Spuren sind an dieselbe Konstituente *D* gebunden.

Aus (64) folgen (4b) und (27), und das Prinzip trägt den Beispielen (63) sowie dem Umstand, daß die Anapher bei (51) und (57) obligatorisch ist, Rechnung. Intuitiv kann man das Auftreten von freien Spuren in nicht-ersten Konjunkten nach (64) als Folge ihrer Kongruenzeigenschaft verstehen.

**3.6** Viele der bislang besprochenen Fälle legen die Vermutung nahe, daß zu jedem Beispiel mit SLF-Koordination ein entsprechendes Beispiel mit phrasaler Koordination und/oder Koordination ganzer Sätze existiert. Diese Vermutung ist unrichtig.

Zunächst ist klar, daß in vielen Fällen mit indefinitem Subjekt keine semantisch gleichwertige Ausdrucksweise mit einer Anapher oder einer wörtlichen Wiederholung des Subjekts an Stelle von *SL* möglich ist. So ist (65a) unmöglich und (65b) nicht gleichwertig mit (40a):

	- b. hoffentlich sieht uns keiner und zeigt uns keiner an

Bei (65b) richtet sich die Hoffnung darauf, weder gesehen noch angezeigt zu werden; bei (40a) richtet sie sich darauf, nicht aufgrund des Gesehenwerdens angezeigt zu werden. Dieser Unterschied ist charakteristisch: SLF-Koordinationen haben immer eine Interpretation, die einen unmittelbaren natürlichen Zusammenhang zwischen den Prädikaten supponiert. Bei wiederholten Subjekten (in der Koordination vollständiger Sätze und bei phrasaler Koordination) ist diese 'fusionierte' Interpretation unmöglich; bei phrasaler Koordination mit dem Subjekt als gemeinsamer Bezugskonstituente der Konjunkte ist sie im Allgemeinen nicht notwendig. (Im Englischen zeichnen sich phrasale Koordinationen mit fusionierter Interpretation nach Hutchinson (1975) dadurch aus, daß sie – so wie SLF-Koordinationen – nicht dem CSC unterliegen. Im einzelnen sind die Fakten jedoch wesentlich anders als im Deutschen.)

Ganz klar ist das häufig bei F1-Sätzen. In (66) haben wir zwei getrennte Fragen: nach dem Rumstehen und nach dem Verteilen der Flugblätter:

(66) stehen da schon wieder welche rum und verteilen sie Flugblätter?

In (40c) dagegen wird nach einer komplexen Tätigkeit: dem mit Flugblätterverteilen verbundenen Rumstehen gefragt. Zu (42c) gibt es gar keine akzeptable Alternative mit lexikalischer Realisierung von *SL*:

(67) ist Karl etwa nicht zur Arbeit gegangen, sondern (\*er) hat (\*er) sich ins Bett gelegt?

Ähnlich verhält sich (68):

(68) weder befolgt er unsere Anweisungen und kümmert sich um die Hunde, noch tut er sonst was nützliches

Hier haben wir wie in (47a) zwei F2-Sätze, die durch *weder – noch* verknüpft sind; das *weder* steht in der *K*-Position des ersten F2-Satzes, der eine SLF-Koordination darstellt. Hier scheint eine phrasale Koordination mit *er* in *K* (69a) möglich zu sein, aber in keinem Fall kann *er* im zweiten Konjunkt wiederholt werden (69b), (69c):

	- b. \* weder befolgt er unsere Anweisungen und kümmert er sich um die Hunde, noch …
	- c. er befolgt weder unsere Anweisungen und (\*er) kümmert (\*er) sich um die Hunde, noch …

Auch zu (70a) gibt es eine Alternative mit phrasaler Koordination, aber keine Möglichkeit, *SL* durch ein Pronomen zu realisieren:

	- b. Karl steht wahrscheinlich im Flur und schwatzt mit den Kollegen
	- c. \* wahrscheinlich steht Karl im Flur und schwatzt er mit den Kollegen
	- d. Karl steht wahrscheinlich im Flur, und er schwatzt mit den Kollegen

Eine Koordination vollständiger Sätze wie in (70d) ist zwar möglich, aber semantisch nicht mit (70b) gleichwertig. Darauf kommen wir zurück.

In allen Fällen, wo die Realisierung des Subjekts im letzten Konjunkt ausgeschlossen oder schlecht ist, sind Konstruktionen wie (52) naturgemäß ebenfalls ausgeschlossen; etwa in (71b):

	- b. \* uns heißt keiner<sup>i</sup> willkommen und schließt er<sup>i</sup> in die Arme

### 4 Subjektlücken in Koordinationen

Es gibt darüber hinaus Fälle, in denen solche Konstruktionen aus undurchsichtigen Gründen ausgeschlossen sind. So gibt es neben den SLF-Koordinationen in (72) die phrasale Koordination (73a) mit dem Subjekt in *K* und die Koordination vollständiger Sätze (73b), aber die phrasale Koordination mit dem Objekt in *K* ist unmöglich:

	- b. mir ist neulich dein Onkel begegnet und hat mir unter die Arme gegriffen
	- b. dein Onkel ist mir neulich begegnet, und er hat mir unter die Arme gegriffen
	- c. \* mir ist neulich dein Onkel begegnet und hat er unter die Arme gegriffen

Ähnlich bei (74) und (75):

	- b. den Jungen beunruhigt diese Vorstellung offenbar und macht ihn ganz krank
	- b. diese Vorstellung beunruhigt den Jungen offenbar, und sie macht ihn ganz krank
	- c. \* den Jungen beunruhigt diese Vorstellung offenbar und macht sie ganz krank

Prädikate wie *begegn-* und *beunruhig-* weisen auch in anderen Zusammenhängen besondere Eigenschaften auf; aber wie daraus die Unmöglichkeit von (73c) und (75c) folgen könnte, ist nicht klar. Dieses Problem berührt jedoch (72) und (74) nicht; diese Beispiele haben die normalen Eigenschaften von SLF-Koordinationen.

**3.7** Gegen die Annahme, daß eine Konstituente in *K* bei SLF-Koordinationen nicht für beide Konjunkte als gemeinsame Konstituente fungieren kann, scheinen Beispiele wie (42a,b) und (53) zu sprechen. Der adverbiale Ausdruck in *K*

scheint dort allen Konjunkten gemeinsam zu sein. Dies kann jedoch nicht generell gelten; die Beispiele in (76) zeigen, daß der adverbiale Ausdruck in *K* nur zum ersten Konjunkt gehört:

	- b. in Mainz fährt Karl am Abend los und kommt am Morgen in Bonn an
	- c. in Köln wohnen ein paar Mafiahäuptlinge und beherrschen von dort aus den gesamten Großhandel

Vgl. demgegenüber die unakzeptablen Beispiele mit phrasaler Koordination in (38).

Das Adverbiale in *K* kann sich nicht ausschließlich auf ein nicht-erstes Konjunkt beziehen:

	- b. \* in Bonn fährt Karl in Mainz am Abend los und kommt am Morgen an
	- c. \* von Köln aus wohnen ein paar Mafiahäuptlinge dort und beherrschen den gesamten Großhandel

Das entspricht genau dem, was wir in den Abschnitten 3.3 und 3.5 bei Objekten gefunden haben.

Möglicherweise ist der Bezug, den ein nicht-erstes Konjunkt zu dem Ausdruck in *K* manchmal zu haben scheint, rein pragmatischer Art, wie er ähnlich auch in Diskursen möglich ist. So wird man, ähnlich wie in (53), auch in (78) den Tag des Abholens mit dem Tag des Kommens identifizieren:

(78) gestern ist jemand gekommen, den ich noch nie vorher gesehen habe; er hat die Sachen abgeholt

Dafür spricht auch die Tatsache, daß ein Prädikat, das obligatorisch an ein Adverbiale gebunden ist, bei SLF-Koordinationen nicht in einem nicht-ersten Konjunkt auftreten kann:

	- b. im Süden hält man sich vernünftigerweise nicht im Sommer auf, sondern verbringt den Herbst \*(dort)

4 Subjektlücken in Koordinationen

Auch in anderen Fällen scheint ein lokales Adverbiale in *K* keinen möglichen Bezug auf das zweite Konjunkt haben zu können:

(80) in Bonn wohnt Karl schon seit langem, arbeitet aber erst seit kurzem

Der Satz hat nicht die Implikation, daß Karl (erst seit kurzem) in Bonn arbeitet, sondern daß er erst seit kurzem einer Arbeit nachgeht, wobei der Ort der Arbeit unbestimmt ist.

Eine Schwierigkeit scheinen Interrogativsätze mit adverbialem Interrogativum zu sein; vgl. außer (40b) auch (81):

(81) wo tritt die Kommission zusammen und beratschlagt über die Petition?

Wenn die Beobachtungen im Zusammenhang mit (58) richtig sind, muß das Interrogativum mit beiden Konjunkten verknüpft sein; eben dies ist bei den AdverbialenAdverbiale in (76), (79), (80) aber nicht der Fall. Wir haben jedoch schon bei (58) gesehen, daß diese Beziehung des Interrogativums zu dem zweiten Konjunkt vermutlich nicht syntaktischer Natur ist; jedenfalls scheinen die nicht-interrogativen Beispiele in (57) den Fällen mit Adverbiale durchaus zu entsprechen.

Fälle wie (82) scheinen dafür zu sprechen, daß doch ein in engerem Sinne grammatischer Bezug zwischen dem temporalen Adverbiale in *K* und dem zweiten Konjunkt besteht:

	- b. ? gestern haben alle ihre Sachen gepackt und wollen ausziehen
	- c. ? gestern hat Karl sich eine eigene Matratze gekauft und schläft allein

Mit Präteritum bzw Perfekt im letzten Konjunkt sind die Beispiele einwandfrei:

	- b. gestern haben alle ihre Sachen gepackt und wollten ausziehen
	- c. gestern hat Karl sich eine eigene Matratze gekauft und hat allein geschlafen

Möglicherweise sind diese Verhältnisse jedoch eine Folge der 'fusionierten' Interpretation, die den SLF-Koordinationen eigentümlich ist. Eine solche fusionierte Interpretation zu konstruieren ist bei Gleichzeitigkeit der Konjunktinhalte wie in (83) kein Problem, kann aber schwierig sein, wenn wie in (82) ein Konjunkt ein Vergangenheitstempus und das andere Präsens hat. Durch geeignete Adverbiale im letzten Konjunkt kann eine solche Interpretation aber in manchen Fällen erzwungen werden; (84) scheint durchaus akzeptabel:

	- b. gestern hat Karl sich eine eigene Matratze gekauft und schläft ab sofort allein

Diese Deutungsversuche stützen sich auf die Tatsache, daß temporale und lokale Angaben häufig eine Lokalisierung fixieren, die über längere Diskursstrecken hinweg konstant bleiben kann. Die semantische Relevanz von Satzadverbialen wie *vielleicht*, *hoffentlich*, *wahrscheinlich* ist dagegen strikt auf den Satz beschränkt, in dem sie vorkommen. In einem Diskurs wie (85) ist nur der erste Satz im Bereich des Adverbials; der zweite wird als zweifelsfrei wahr hingestellt:

	- b. hoffentlich sind deine Freunde schon angekommen; sie verteilen Flugblätter

In SLF-Koordinationen (86a), in phrasalen Koordinationen (86b) und bei gespaltenen Konjunkten (86c) ist es dagegen möglich oder sogar unvermeidbar, die Sätze so zu interpretieren, daß das zweite Konjunkt im Bereich des Adverbials ist:

	- b. deine Freunde sind hoffentlich schon angekommen und verteilen Flugblätter
	- c. Karl hat wahrscheinlich den Hund gefüttert und den Kater

Interessanterweise ist es auch bei der Koordination vollständiger Sätze wie in (87) möglich, die gesamte Koordination als Bereich des Adverbials zu interpretieren:

(87) hoffentlich füttert Karl den Hund und Heinz füttert den Kater

Soweit Gapping mit der Wortstellung von (88) akzeptabel ist, ist die Interpretation mit weitem Bereich hier zwingend:

(88) Karl füttert hoffentlich den Hund und Heinz \_\_\_ den Kater

Bei der SLF-Koordination in (86a) steht das Adverbiale in *K*. Das muß nicht so sein; (89) kann in genau derselben Weise mit weitem Bereich des Adverbials interpretiert werden:

(89) gestern ist wahrscheinlich jemand gekommen und hat die Sachen abgeholt

### 4 Subjektlücken in Koordinationen

Derartige Satzadverbiale können (oder müssen, in gewissen Fällen) zwar in SLF-Koordinationen als Konstituenten fungieren, zu denen alle Konjunkte einen gemeinsamen Bezug haben. Dies ist jedoch keine spezifische Eigenschaft von SLF-Koordinationen, sondern gilt, wie wir gesehen haben, ganz allgemein für Koordinationen. Und anders als bei allen anderen Arten von gemeinsamen Konstituenten, die wir bei den verschiedenen Koordinationstypen besprochen haben, scheint es kaum irgendwelche spezifischen, im engeren Sinne grammatischen Bedingungen zu geben. Es scheint ein allgemeines Prinzip zu gelten:

(90) Wenn ein Adverbiale *A* im ersten Konjunkt einer Koordination das gesamte Konjunkt (abgesehen von Adverbialen wie *A*) in seinem Bereich haben kann, dann kann es auch die nicht-ersten Konjunkte in seinem Bereich haben.

Zu den adverbialen Ausdrücken rechnet man oft auch die Negationspartikel *nicht*, und in der Tat gilt für sie weitgehend das gleiche wie für *hoffentlich* usw. Es gibt eine wichtige Einschränkung: Bei der Koordination vollständiger Sätze wie in (91) kann das letzte Konjunkt nicht im Bereich von *nicht* liegen:

	- b. Karl füttert nicht den Hund, oder Heinz füttert den Kater
	- c. Karl füttert nicht den Hund, aber Heinz ist fleißig

Bei Gapping scheint die Koordination mit *nicht* nicht möglich zu sein (92a); bei *aber* (92b) ist nur das erste Konjunkt im Bereich von *nicht*; bei *oder* (92c) ist das Urteil nicht ganz klar: Die Beschränkung des Bereichs auf das erste Konjunkt ist stark bevorzugt, aber die Extension auf das letzte Konjunkt scheint nicht ganz unmöglich zu sein:

	- b. Karl füttert nicht den Hund, aber Heinz den Kater
	- c. Karl füttert nicht den Hund oder Heinz den Kater

Bei SLF-Koordinationen (93a), phrasaler Koordination (93b) und gespaltenen Konjunkten (93c) kann das letzte Konjunkt im Bereich von *nicht* sein:

	- b. Karl ist nicht zurückgekommen und hat seine Sachen geholt (sondern das Zeug steht immer noch hier rum)
	- c. Karl wird nicht den Hund füttern oder den Kater (sondern er wird mit seinem Kaninchen spielen)

In (93a) ist *nicht* im Bereich von *hoffentlich*; alle anderen Teile des Satzes sind (in einer naheliegenden Interpretation) im Bereich von *nicht*. Für solche Fälle ist die Einschränkung " abgesehen von Adverbialen wie *A*" in (90) gedacht. Auch andere Arten von Elementen können weiteren Bereich als *nicht* haben:

	- b. deshalb hören viele Teilnehmer nicht zu und schreiben eifrig mit (sondern bohren in der Nase)

Wie man an (94b) sieht, sind Interaktionen zwischen Negation und Quantifizierung von der Bereichsvorschrift (90) ausgenommen; *viele Teilnehmer* hat hier größeren Bereich als *nicht*.

### **4 Zusammenfassung**

Außer der charakterisierenden Eigenschaft (41) haben wir folgende Eigenschaften bei SLF-Koordinationen gefunden:

	- b. In nicht-ersten Konjunkten kann keine Konstituente getilgt werden.
	- c. Nicht-erste Konjunkte können keine freie Spur enthalten.
	- d. Im ersten Konjunkt ist keine Linkstilgung möglich.
	- e. Adverbiale im ersten Konjunkt können ihren Bereich auf die nicht-ersten Konjunkte ausdehnen.
	- f. Die koordinierten Satzbestandteile werden als 'fusioniert' interpretiert, wie es auch bei phrasaler Koordination mit dem Subjekt als gemeinsamem Bezug möglich ist.

Die Eigenschaften (95a) und (95f) sind ohne Erklärung. (95b) kann man so verstehen, daß in SLF-Koordinationen keine Tilgungen angewendet werden, die nicht auch in anderen Konstruktionen anwendbar sind. In (95c) zeigt sich möglicherweise eine allgemeine Eigenschaft aller Arten von nicht-ersten Konjunkten. Die einzige Ausnahme sind phrasale Koordinationen; dort kann man das streng geregelte Auftreten von freien Spuren in nicht-ersten Konjunkten wahrscheinlich als Folge der Kongruenzbedingung verstehen, der diese Konjunkte unterliegen. Wenn *SL* keine syntaktische Realisierung hat, sind die Konjunkte von SLF-Koordinationen vermutlich nicht kongruent. Aus dieser Annahme folgt wahrscheinlich auch (95d). (95b)–(95d) führen zusammen dazu, daß die nicht-ersten Konjunkte ausschließlich zum Subjekt denselben grammatischen Bezug haben wie

4 Subjektlücken in Koordinationen

die koordinierten Teile des ersten Konjunkts. (95e) ist (mit gewissen Qualifikationen) eine allgemeine semantische Eigenschaft aller Koordinationstypen.

In gewissem Maße scheint es also möglich zu sein, Eigenschaften von SLF-Koordinationen auf allgemeinere Gesetzmäßigkeiten zurückzuführen. Für die beiden charakterisierenden Eigenschaften in (96) fehlt jedoch jede Erklärung:

	- b. Die finiten Verben haben die Position, die sie in unkoordinierten F-Sätzen hätten.

Bei phrasalen Koordinationen folgen die topologischen Eigenschaften der finiten Verben aus der Kongruenzeigenschaft der Konjunkte. Da den Konjunkten von SLF-Koordinationen diese Eigenschaft offenbar abgeht, ist es völlig offen, warum Beispiele wie in (97) oder (98) unmöglich sind:

	- b. \* es ist zu hoffen, daß bald jemand einen Einfall hat und sagt uns die Lösung
	- c. \* es ist unwahrscheinlich, daß Karl gestern gekommen ist und hat die Sachen abgeholt
	- b. \* wann hat jemand einen Einfall und uns die Lösung sagt?
	- c. \* gestern ist Karl gekommen und die Sachen abgeholt hat

### **Literatur**


### **Chapter 5**

## **On composition and derivation: The constituent structure of secondary words in German**

Tilman N. Höhle

### **0 Introduction<sup>∗</sup>**

The theory of word formation that I would like to sketch here is in two respects a "lexicalist" theory.<sup>1</sup>

<sup>1</sup>This article is based on an "Excursus on the Theory of Word Formation" from January 1976 (in Höhle 1976) which was not included in the printed version of that work; cf. Höhle (1978: 68). – I would like to thank the editors of the *Zeitschrift für Sprachwissenschaft* for some critical comments; for discussion of individual points I also extend thanks to Marga Reis and Jindřich Toman.

Tilman N. Höhle. 2019. On composition and derivation: The constituent structure of secondary words in German. In Stefan Müller, Marga Reis & Frank Richter (eds.), *Beiträge zur deutschen Grammatik. Gesammelte Schriften von Tilman N. Höhle. Second revised edition*, 219–278. Berlin: Language Science Press. DOI:10.5281/zenodo.2588355

<sup>§</sup> *Editors' note:* This work was originally published in one of the earliest collections of generative papers on German grammar that appeared in English (Toman, Jindřich (ed.). 1985. *Studies in German Grammar* (Studies in Generative Grammar 21), 319–376. Dordrecht: Foris.). As pointed out in the author's note \*, this work is basically the English version of a German article (Höhle 1982b) to which a number of clarifying notes have been added. For reasons of comparability with the German version we have retained the unusual numbering of these notes in the present version. Otherwise, the layout and citation style have been adapted to the format chosen for this volume.

<sup>∗</sup>An earlier version of this article has appeared as (Höhle 1982b). While the text has largely been kept unchanged, some clarifying remarks are contained in added notes (indicated by a letter after the note, e.g., note 2a). Susan Olsen has done an admirable job in translating the original version and correcting the amendments, thereby contributing to a less cryptic formulation of numerous passages.

First of all in a general sense, inasmuch as it is not a "transformationalist" theory. This finds justification in the observation that the products of word formation – morphological elements formed from other morphemes or morpheme complexes – typically display structural and semantic properties that differ distinctly from those of syntactic phrases. (For discussion, cf., e.g., Toman (1980) and Vögeding (1981).)

Secondly in a more specific sense. It is usually assumed that a grammar contains a set of lexical entries, where a lexical entry is an *n*-tuple of characterizations of *n* different types of properties exhibited by a morpheme or morpheme complex. Usually a morpheme (morpheme complex) displays at least phonological, logical ("semantic") and categorial properties. Hence, its lexical entry will consist (in part, at least) of a phonological, a logical, and a categorial characterization. The latter specifies above all the syntactic category and the selectional properties of the element (cf. Höhle 1978: 14f.).<sup>2</sup>

With this background, it is natural to represent the difference between free and bound morphemes in the same manner as the differences between intransitive and transitive verbs or between "full" verbs and "helping" verbs, namely as differences in their selectional properties. Transitive verbs differ from intransitive verbs in that they select an accusative object; "helping" verbs, as opposed to full verbs, select (a class of) other verbs (for more precise discussion, cf. Höhle 1978: 77–92). Accordingly, bound morphemes select other morphemes (or classes of morphemes), to which they are thereby bound, while free morphemes do not.

These are minimal assumptions. It is my theory that, in connection with a few additional assumptions which I consider to be well-founded and/or unproblematic, these assumptions are at the same time sufficient to account for the essential features of compositions and affixal derivations.2a

<sup>2</sup> If one seriously considers the idea that all unpredictable properties of lexical elements should be treated as part of their lexical entry, it becomes evident that various grammatical phenomena can be accounted for better in this manner than by means of syntactic transformations. For an example of such a treatment of different infinite constructions and especially the passive constructions, cf. Höhle (1978).

<sup>2</sup>aWhat is meant are the essential grammatical features. Aspects of language use have to be dealt with by other theories. Hence, I am not concerned here with questions relating to the popularity of individual patterns of word formations (often discussed under the heading of 'productivity') or with various inventions on the part of creative language users changing either grammatical rules or properties of lexical elements.

I am restricting my attention, furthermore, to certain classical types of word formation. I have nothing to say, e.g., about syllable-based affixal derivations as in (i) or about clippings as in (ii):

<sup>(</sup>i) a. *Schlaffi* 'limp-y'/"non-aggressive person" (from *schlaff* 'limp')

5 On composition and derivation

### **1 A lexicalist theory of word formation**

I suggest assigning compounds an internal constituent structure in such a way that, e.g., *Schwimmbad* 'swim-bath'/"bathing establishment" is to be represented as (1a) and *denkfaul* 'think-lazy'/"mentally lazy" as (1b):

	- b. [<sup>A</sup> [<sup>V</sup> denk] [<sup>A</sup> faul] ]

Along the same lines, I would like to assign affixal derivations an internal constituent structure such that, e.g., *Vermeidung* 'avoid-ing'/"avoidance" is to be represented as (2a) and *vermeidbar* 'avoid-able' as (2b):

(2) a. [<sup>N</sup> [<sup>V</sup> vermeid] [<sup>N</sup> ung] ] b. [<sup>A</sup> [<sup>V</sup> vermeid] [<sup>A</sup> bar] ]

A few remarks are necessary here.

### **1.1 Compounds**

The representation of compounds as in (1) is widely accepted in the literature. This is intuitively reasonable since the noun *Schwimmbad* is obviously formed on the basis of the verb *schwimm*- 'swim' and the noun *Bad* 'bath'. On the other hand it is not self-evident that compounds have the structure shown in (1).

In a lexicalist theory such a structure presupposes an extension of the usual phrase structure rules to a rule like (3):

(3) *X <sup>0</sup> → Y <sup>0</sup>* ͡*Z 0*

Here *X, Y, Z* are variables ranging over syntactic categories; the superscript "0" indicates in accordance with X-theory (cf., e.g., Jackendoff 1977), that the expansion takes place at the zero-bar level, so that *Y 0* and *Z 0* are lexical elements or

	- b. *(das) Mikro* 'the*neut.* microphone' ( from *Mikrophon* (neut.) 'microphone'
	- c. *Vorzüge* "preference shares" (from *Vorzugsaktien* 'preference-shares'); opposed to *Vorzüge* 'virtues'

b. *Asi* "anti-social person" (from *asozial* 'anti-social')

c. *Conti* "person injured through Contergan" (from *contergangeschädigt* 'Conterganinjured')

derive recursively from lexical elements by (3). If *X* and *Z* have the value A (Adjective) and *Y* = V (Verb), we obtain structures like (1b) (and (2b)).

An alternative would be to postulate a special word formation rule in place of (3) which would operate on lexical entries as well as on its own output, generating secondary morphological elements. This rule could take approximately the form of (4):

(4) If *φ* is an element of the category *Y 0* and *ψ* is an element of the category *Z 0* , then *φ* ͡*ψ* is an element of the category *X 0* .

An instantiation of (4) would be: if *schwimm* is a V and *bad* an N, then *schwimm* ͡*bad* is an N. According to this suggestion *Schwimmbad* is not to be analyzed as (1a) but without internal constituent structure as in (5):

(5) [<sup>N</sup> schwimm ͡ bad]

Analogously for other compounds.

It is not clear from the start whether analyses like (1) in connection with a rule like (3) differ empirically from analyses like (5) in connection with a rule like (4) and, if so, whether one has advantages over the other. Certain stress phenomena to be discussed in Section 9 indicate however that (1) is more adequate than (5). I will assume therefore that for word formation constructions with the category feature [+*N*] – i.e., secondary adjectives and nouns – rule (3) and structure (1) are to be adopted. (The situation is somewhat different with verbs in that their formation possibly obeys in part other principles; I will comment on this only in passing.)

### **1.2 Derivations**

Whereas representations of compounds as in (1) are largely accepted, an analysis of derivations as in (2) is definitely unusual. Chomsky & Halle (1968), e.g., have (6) for *blackboard* but (7) for *analyzable* (somewhat simplified in each case):


In this tradition *Vermeidung* and *vermeidbar* would not be represented as in (2) but as in (8):

(8) a. [<sup>N</sup> [<sup>V</sup> vermeid] ung] b. [<sup>A</sup> [<sup>V</sup> vermeid] bar]

### 5 On composition and derivation

Analyses such as (8) differ in two respects from those of (2). (i) The bound morphemes -*ung* and -*bar* in (2) have a category label in the same fashion as the free morphemes *bad* and *faul* in (1); in (8), however, they are not marked for a category. (ii) Derivations have according to (2) exactly the same categorial structure as compounds, whereas in (8) they are essentially different in structure. The differences (i) and (ii) are obviously connected in that (ii) presupposes (i).

The difference between (1) and (8) as well as between (6) and (7) appears intuitively reasonable: according to widespread opinion the distinction between composition and derivation is of a fundamental and essential nature. It seems only proper to have it reflected in the different constituent structures assigned to the products of word formation. And the fact that *bad* and *faul* in *Schwimmbad* and *denkfaul* should have a category label seems reasonable since these elements must carry the same labels when they occur as syntactic words. One cannot, of course, argue for a category label for -*ung* and -*bar* on the basis of the same observation, since the latter do not occur as words.

Nevertheless, it is clear that within a lexicalist theory of word formation analyses like (8) are formally impossible if one retains the usual conventions for the insertion of morphological elements into phrase structures (or equivalent wellformedness conditions). No known type of phrase structure rule will generate structures of the form (9) in such a way as to allow lexical elements of the form (10) to be inserted:3*,*3a

<sup>3</sup>This problem does not arise in Chomsky & Halle (1968): they presuppose a transformationalist theory of word formation. Such a theory can generate structures like (9) simply because within it syntactic transformations have the power to define almost arbitrary relations between input and output structures.

One of the many problems with Aronoff's theory (Aronoff 1976) of word formation is that he, on the one hand, tries to present a lexicalist theory but, on the other hand, formulates rules that generate structures like (10). It is not clear how such elements can be placed into a phrase marker in line with known conventions.

Lack of clarity in formal matters is not limited to Aronoff alone. Siegel, for instance, is of the opinion that Aronoff's word formation rules are "a special kind of transformation" and that they produce "Chomsky adjunction of an affix" (Siegel 1978: 189). Both assertions are misleading. In the technical sense transformations are relations which are formulated for pairs of phrase markers; Aronoff's word formation rules however are formulated for lexical entries. (For more on this distinction, cf. Höhle (1978: 10).) Furthermore, Chomsky adjunctions have the form [*<sup>X</sup> <sup>n</sup>* [*<sup>Y</sup> <sup>m</sup> φ* ] [*<sup>Z</sup> <sup>k</sup> ψ* ] ] or [*<sup>X</sup> n* [ *Z <sup>k</sup> ψ* ] [*<sup>Y</sup> <sup>m</sup> φ* ] ], where *X n* = *Y m* ; in Aronoff's rules however the "outer" category *X n* is not necessarily related to the "inner" category *Y m* (and the affix *ψ* does not carry a categorial label *Z k* ).

Wurzel (1970) suggests a very peculiar solution. It contains many unclear points; yet it is apparent that he assigns to derivations a superficial structure like (8) on the one hand while deriving them from structures which are very similar to (2) on the other (Wurzel 1970: §5.2).

<sup>3</sup>aIt is possible, of course, to devise rules and conventions that allow structures like (9) and (10) to be generated. The point is that this requires explicit stipulations which (i) have not been spelled out and (ii) could hardly be viewed as natural extensions of general theoretical assumptions.


As an alternative to (2), the only other possibility provided by a lexicalist theory would be to describe derivations without internal constituent structure as in (11):

```
(11) a. [N vermeid ͡ ung]
      b. [A vermeid ͡ bar]
```
(Such representations have been proposed, e.g., by Jackendoff (1975) and Hust (1978).)

As in the case of composition, such representations presuppose again special word formation rules. If -*ung* and -*bar* have lexical entries which assign a category label to these suffixes, then a rule of the form (4) can be applied. These elements would, however, still have to somehow carry the information that they – as opposed to the constituents of compounds – are (i) obligatorily subject to this rule and (ii) may only be interpreted as the variable *ψ*, that is as the second component of the secondary word.

If, on the other hand, affixes are not considered to be members of a syntactic category, the most plausible analysis would be to formulate a separate "rule" for each affix along the lines of (12):

	- b. If *φ* is a V, then *φ* ͡*bar* is an A

### **1.3 The "compositional theory of affixation"**

Once again, it is not at all clear whether the differences between (2) and (11) can be directly correlated to any empirical differences and, in case (11) were to be preferred to (2), whether rules like (12) or those like (4) are superior. One thing, however, is clear: if one analyzes compositions in the way I have suggested above, then no new mechanism whatsoever is necessary for the generation of affixal derivations. Rules of the form (3) generate structures of the form (2) exactly as they do structures of the form (1). If we require bound morphemes to be represented by normal lexical entries, specifically as members of a syntactic category, representations like (2) will be generated by normal lexical "insertion" exactly like (1).

5 On composition and derivation

The distinction between composition and affixal derivation in this theory is not expressed in the constituent structure but rather can be reduced entirely to the use of a bound lexical element in the case of a derivation. I will term such a theory "strictly lexicalist"; and because of the formal similarity of compositions and derivations I will also call it "the compositional theory of affixation".

### **2 Composition vs. derivation**

If one is of the opinion that there is somehow a fundamental difference between composition and derivation, one must observe that the fundamental nature of this difference has not been made clear in the literature. Instead, two types of explication are common.

### **2.1 First explication**

The first type of explication can be formulated as in (13):

(13) If a morpheme or morpheme complex *M*<sup>S</sup> is formed on the basis of *n* morphemes (or morpheme complexes) *M*<sup>1</sup> , … , *M<sup>n</sup>* of which two (or more) are *lexematic* morphemes (morpheme complexes), then *M*<sup>S</sup> is a composition. If less than two lexematic morphemes (morpheme complexes) are involved, then *M*<sup>S</sup> is a derivation.

This type of explication presupposes a partition of the set of lexical elements in a language into "lexematic" and "grammatical" elements. A problem arises from the start: there exists no general and reliable criterion for recognizing a "lexematic" or "grammatical" element (see, e.g., Langacker (1973: 76f., 81); he uses "lexical" in place of "lexematic"). Secondly, this type of explication suggests that the distinction is in no way essential or even noteworthy (insofar as for the subscript of *M<sup>n</sup> n >* 1 is true). For as long as the *M<sup>i</sup>* (1 *≤ i ≤ n*) can be characterized as "lexematic" or "grammatical" at all, this characterization can undoubtedly be understood as a property expressed by the respective lexical entry for *M<sup>i</sup>* . (This can be said at least for those "grammatical" morphemes that are assumed to play a role in derivations.) That means that the distinction between composition and derivation can be reduced entirely to independently given information concerning the *M<sup>i</sup>* . In particular, (13) cannot substantiate the assumption that composition and derivation involve different rule mechanisms or that compositions and derivations have different constituent structures.

### **2.2 Second explication**

The second type of explication can be formulated as in (14):

(14) If a morpheme or morpheme complex *M*<sup>S</sup> is formed on the basis of *n* morphemes (or morpheme complexes) *M<sup>1</sup>* , … , *M<sup>n</sup>* of which two (or more) can occur freely, then *M*<sup>S</sup> is a composition. If less than two free morphemes (morpheme complexes) are involved, then *M*<sup>S</sup> is a derivation.

This type of explication differs from (13) in that in place of the dubious partition into "lexematic" and "grammatical" elements the no doubt essential partition into "free" and "bound" elements is found. (It is essential in that it is not reducible to any independently established property.) For this reason I will henceforth make reference to (14) and not to (13).<sup>4</sup> In other respects, the same can be said for (14) as was remarked for (13): this explication reduces the distinction between composition and derivation entirely to independently established properties of the morphemes (morpheme complexes) involved; in particular it is completely compatible with the strictly lexicalist theory which leads to representations like (1) and (2).

However, the expressions "free" and "bound" are in need of qualification. In accordance with tradition, I will say that a *M<sup>i</sup>* can occur "freely" even if *M<sup>i</sup>* must bear inflectional characteristics if it is to be used as a syntactic word (with the meaning held constant). A distinction between "inflection" and "word formation in a narrower sense" (= composition and derivation) as is implied by this notion of "free" is not without problems. It is supported, however, among other things by the fact that it facilitates the formulation of the principles of word formation. For example, initial adjectival and verbal components of secondary words are generally not inflected; cf. *Kurzurlaub* 'short-vacation'/"short leave" vis-àvis *kurzer Urlaub* 'short vacation' and *Schwimmbad* vis-à-vis \**Schwimm*t*bad*,

<sup>4</sup>The relationship between the nouns *Fisch* 'fish', *Besuch* 'visit', *Pfiff* 'whistle', *Betrug* 'deceit' and the verbs *fisch-* 'fish', *besuch-* 'visit', *pfeif-* 'whistle', *betrüg-* 'cheat' is according to both (13) and (14) one of derivation, even without assuming a "zero morpheme" or "process morpheme", because these nouns are formed on the basis of less than two free (or lexematic respectively) morphemes (morpheme complexes). In cases like these the subscript of *M<sup>n</sup>* may be interpreted as *n* = 1.

Under both modes of explication words like *Handschuh* 'hand-shoe'/"glove" and *Handtuch* 'hand-cloth'/"towel" can, of course, only be accounted for inasfar as they can be understood as products of productive word formation processes. To the extent that *Handschuh* denotes something that has nothing to do with shoes and *Handtuch* denotes something that does not necessarily have to do with hands – witness, e.g., *Fußhandtuch* 'foot-hand-cloth'/"foot towel" – such words have to be seen as idiomatic complexes, i.e., as lexical entries of a special kind (cf. Höhle 1978: 27f.).

5 On composition and derivation

\**Schwimm*en*bad*, etc.4a,5

Bound morphemes in the strictly lexicalist theory are generally characterized by lexical entries as illustrated in (15) for -*ung* and in (16) for -*bar*:


I have simplified the phonological characterization (PhC) of the morphemes by using conventional orthography; I leave the logical characterization (LC) open here. From the categorial characterization (KC) it can be seen that -*ung* is a noun and -*bar* an adjective and that both elements directly follow a sister constituent of the type Verb (to which they are consequently "bound") within a *X 0* constituent. (More precise discussion of -*bar* can be found in Höhle (1978: 66f.) and Toman (1980).) By means of these lexical entries -*ung* and -*bar* are unambiguously identified as suffixes; representations like (2) are therefore to be understood as derivations and those like (1) in which only free morphemes are involved exemplify compositions, according to (14). If the distinction between composition and derivation is indeed characterized adequately by (14), then there can be no objection on these grounds to the "compositional theory of affixation".

### **2.3 The role of paraphrases**

Certain possibilities of paraphrasing word formation constructions follow from the free/bound distinction.

Compounds can generally be paraphrased in such a way that their constituents occur as free elements in the paraphrase. For instance, one can form paraphrases of *Gartentür* 'garden-door' like (17):

<sup>4</sup>aWhen inflectional characteristics are removed from a word what remains is a 'stem'. A stem – like any other lexical element – has a set of categorial features associated to it (cf. note 16a). Many stems are free in the sense of (14) although they never constitute words by themselves (since they have to get inflectional characteristics if they are to be used as words). – The term "root" will not be used in this article.

<sup>5</sup>The 'unmarked' stem of a verb (which is the form generally used in word formation) is the stem of the 2.pl.pres.ind.; e.g., (*ihr* 'you', pl.) *schrei-t* 'cry', *sei-d* 'be-*t*'/"are" (the spelling *d* with *seid* is irregular), *tu-t* 'do', *woll-t* 'wish', *könn-t* 'can'. The same stem is the basis for the entire present subjunctive (e.g., (*er* 'he') *schrei-e, sei, tu-e, woll-e, könn-e*) and the infinitive (which I consider an infinite inflectional form).

	- b. Tür, 'door die which den the Weg, way der which in in den the Garten garden führt, leads versperrt bars' "door which bars the way leading into the garden"
	- c. Tür, 'door die which für for einen a Garten garden bestimmt intended ist is' "door which is intended for a garden"
	- d. Tür, 'door die which aus out einem a Garten garden stammt stems' "door which stems from a garden"
	- e. Tür, 'door die which etwas something mit with einem a Garten garden zu to tun do hat has' "door which has something to do with a garden"

Similarly one can explain *Schwimmbad* as *Bad, das dazu bestimmt ist, daß man darin schwimmen kann* 'bath which thereto intended is that one therein swim can'/"bath (i.e., establishment with a pool) which is intended to provide an opportunity to swim", and *Karl ist denkfaul* 'Karl is think-lazy' can be approximately paraphrased as *Karl ist faul hinsichtlich des Denkens* 'Karl is lazy in regard to (the) thinking'.

This possibility is excluded for derivations. In rewordings of *vermeidbar* and *Vermeidung* one can make use of the verb *vermeid*- 'avoid' but not of the suffix *-bar* or *-ung*. This follows of course from the fact that these elements are bound morphemes; and the possibility of a paraphrase is not a defining characteristic of compounds but follows from the fact that the parts of a compound can, according to (14), occur freely – provided that this is not prohibited by the interference of general syntactic regularities.

Thus, paraphrases of nominal compounds usually present no problem due to the fact that one can generally employ relative clauses as in (17). The same is, however, not possible with adjectival compounds and, since many adjectives are highly restricted in their ability to combine with other syntactic words, an acceptable paraphrase cannot always be found. Thus, the expression *betriebseigener Sportplatz* 'factory-*s*-own sportsfield'/"sportsfield owned by the factory" can be explained by (18a):

5 On composition and derivation

	- b. Karl 'Karl besucht visits den the betriebseigenen factory-*s*-own Sportplatz sportsfield' "Karl is visiting the sportsfield owned by the factory"
	- c. ? Karl 'Karl besucht visits den the dem the Betrieb factory eigenen own Sportplatz sportsfield'
	- d. ? Karl 'Karl besucht visits den the Sportplatz, sportsfield den which der the Betrieb factory als as eigenen own hat has' "Karl is visiting the sportsfield which is the factory's own"

As soon as the expression is embedded in a sentence as in (18b), finding a paraphrase becomes difficult. If (18c) is acceptable at all (parallel to *die dem Betrieb eigene Dynamik* 'the the factory own dynamics'/"the dynamic force intrinsic to the factory"), it probably does not carry the same meaning as in (18b); and the acceptability of (18d) is definitely questionable (although its meaning would be roughly equivalent to (18b)). Similar difficulties arise with the compounds ending in *intern* 'internal':

	- b. Die 'the Presse press berichtete reported über over interne internal Vorgänge proceedings [of] des the Werks factory' "The press reported on proceedings internal to the factory"
	- c. Die 'the Presse press berichtete reported über over werksinterne factory-*s*-internal Vorgänge proceedings bei at VW VW' "The press reported on internal proceedings at VW"
	- d. VW 'VW hat has betriebsintern factory-*s*-internal eine a Befragung questionnaire durchgeführt through-led' "Internally, VW has carried out a survey"

(19a) can perhaps be paraphrased by (19b), but there does not appear to be a successful way to paraphrase (19c) or (19d) (using the constituents of the compound as words). This last fact does not, of course, necessitate a characterization of compounds versus derivations extending beyond (14).

### **3 Similarity of suffixes to words**

Derivational suffixes typically have a very general "meaning" whereas free morphemes (morpheme complexes) have typically a more specific meaning. With the most frequently used type of compounds one can speak of the first constituent (the so-called determinant, *Bestimmungswort*) semantically determining the second constituent (the so-called determinatum, *Grundwort*); whether one can speak in the same sense of the first constituent of a derivation (the so-called derivational basis) as determining the second constituent (the suffix) is, in contrast, not at all clear.

### **3.1 The case of -***chen*

On the other hand there seems to be no reason not to assign suffixes a logical characterization such that the meaning of the derivation follows from that of its constituents in a similar manner to that of compounds. Above all, it is important to note that one cannot answer this question intuitively: no clear intuition can decide whether, e.g., *Männchen* 'man-*chen*'/"small man" should be assigned the meaning of *kleiner Mann* 'little man' rather than of *kleines Wesen, das ein Mann ist* 'little being which is a man'; both paraphrases seem to be equally good or bad. One can see that the second paraphrase is not absurd from a comparison with the element -*zwerg* as in *Bohrzwerg* 'drill-dwarf '/"small device for drilling", *Waschzwerg* 'wash-dwarf'/"small device for washing", etc. It presumably means something like *kleiner Gegenstand* 'little device' and is semantically related but not identical to the noun *Zwerg* 'small man, dwarf'. There is no reason not to assign the diminutive -*chen* a similar meaning. Furthermore, from examples like *Frühchen* 'early-*chen*'/"baby born prematurely", *Grauchen* 'grey-*chen*'/"little grey one", *Dummchen* 'stupid-*chen*'/"little stupid one", *Geilchen* 'lewd-*chen*'/"little horny one", where -*chen* is suffixed to an adjective, we see without a doubt that the referential properties of derivations ending in -*chen* are not determined by the first constituent but rather by the suffix. Similar considerations are appropriate for other suffixes.

### **3.2 The case of -***fähig*

One can see, moreover, that the difference in type of meaning often found between free and bound morphemes is of a gradual nature just as the difference in bound and free homonymous morphemes (morpheme complexes) is occasionally troublesome, since there can be many different degrees of similarity

### 5 On composition and derivation

in meaning. The adjectival suffixes -*freundlich* (*waschfreundlich* 'wash-friendly'/ "easy to wash"), -*fest* (*säurefest* 'acid-firm'/"acid-resistant"), -*haltig* (*säurehaltig* 'acid-contain-y'/"acidiferous") and the nominal suffixes -*zeug* (*Hebezeug* 'lift-*e*stuff'/"lifting gear"), -*gut* (*Lesegut* 'read-*e*-stuff'/"things to be read") are clearly recognizably related to free morphemes (morpheme complexes) whereas such a relationship is less directly present with -*echt* (*lichtecht* 'light-genuine'/"fast to light"), -*los* (*bedeutungslos* 'meaning-*s*-loose'/"meaningless"), -*mäßig* (*lichtmäßig* 'light-measure-y'/"in regard to light"), -*wesen* (*Bankwesen* 'bank-being'/"banking"), -*werk* (*Mauerwerk* 'wall-work'/"masonry"), and with *-ig, -bar, -chen, -ung, -heit, -tum* is completely nonexistent (although in some cases, at least, historically present).

Constructions with *fähig* as the second constituent show how much more complicated the situation can be than the dichotomy composition/derivation suggests. One can compare the examples in (20) with those in (21) where *fähig* presumably occurs freely in the same meaning:

	- b. Karl 'Karl ist is besserungsfähig improvement-*s*-able' "Karl is capable of improvement"
	- b. Karl 'Karl ist is [of] der the Besserung improvement fähig able' "Karl is capable of improvement"

One of the aspects of the meaning of free *fähig* 'able' is apparently that a being is capable of an intentional action or effort. Can this aspect be found in (22)?

(22) a. Karl 'Karl ist is belastungsfähig burden-*s*-able' "Karl is capable of withstanding strain" b. Karl 'Karl ist is transportfähig transport-able'

"Karl is able to be transported"

These examples cannot be paraphrased by (23); although perhaps by (24):

	- 'Karl is [of] the transport able'
	- b. Karl 'Karl ist is fähig, able einen a Transport transport zu to ertragen bear' "Karl is able to be transported"

The question here is whether the meaning of (22) has been properly reproduced, i.e., whether the intentional element that is present in (24) and typical for free *fähig* is really present in (22).

If *förderungsfähig* belongs to the same class as (22), then (24) is obviously misleading, for (25a) can only be paraphrased half-way adequately by (25d), from which we can conclude that it contains no intentional element:

	- b. \* Karl 'Karl ist is [of] der the Förderung promotion fähig able'
	- c. ? Karl 'Karl ist is fähig, able die the Förderung promotion zu to ertragen bear'
	- "Karl is capable of withstanding the promotion" d. Karl kann gefördert werden
		- 'Karl can promoted become'
		- "It is possible for Karl to be promoted"

This conclusion is substantiated by (26a) and the other examples of (26), which obviously contain only a general element of possibility (and not intentional capability as in (21)); cf. the paraphrases in (27):

(26) a. Eigenheime 'own-homes sind are förderungsfähig promotion-*s*-able' "Private homes are capable of advancement"

	- b. Für 'for bestimmte certain Aufwendungen expenditures kann can eine a Beihilfe subsidy gewährt granted werden become' "A subsidy can be granted for certain expenditures"
	- c. Karl 'Karl kann can einen a Kredit credit bekommen receive' "It is possible for Karl to get a credit"
	- d. Der 'the Wagen car kann can eingesetzt employed werden become' "The car can be used"
	- e. Die 'the Maschine machine kann can man one nicht not (weiter) (further) entwickeln develop' "It is not possible for the machine to be (further) developed"
	- f. Das 'the Manuskript manuscript kann can man one nicht not drucken print' "It is not possible to print the manuscript"

*Fähig* in (26) and probably also in (22) and (25) is therefore not identical to the freely occurring *fähig* of (21) and will have to be characterized as bound. Nevertheless their close semantic similarity cannot be overlooked.

### **3.3 The case of -***gerecht*

Formations with -*gerecht* as in (28a) are also informative; they have a meaning that can be compared to that of (28b):

	- ii. leistungsgerechte 'performance-*s*-just Bezahlung payment' "payment according to performance"
	- b. i. Die 'the Produktion production wird becomes [to] dem the Bedarf need gerecht just' "The production meets the need"
		- ii. Die 'the Bezahlung payment wird becomes [to] der the Leistung performance gerecht just' "The payment meets the performance"

Is this *gerecht* a free element? It appears to be according to (28b). The problem is however that *gerecht werd-* in (28b) is an idiomatic expression. *Gerecht* does not occur in any other environment in the same meaning (specifically not adnominally as the adjective in (28a)), nor does *werd*- have its characteristic inchoative meaning in this connection.<sup>6</sup> Apparently the *gerecht* of (28a) cannot be considered a freely occurring element like others, although *gerecht* in (28b) is a syntactic word. In one understanding of "free", therefore, we have a derivation in (28a), according to (14).

Examples like these show that the strictly lexicalist theory puts the real descriptive problem in its proper place. If no special restrictions were placed on the -*gerecht* of (28a), one would expect it to be able to occur freely in the same meaning in all positions typical of adjectives. Since this is not the case, this *-gerecht* will have to receive contextual restrictions which characterize it as bound. Furthermore, a lexical entry is necessary for the idiomatic expression *gerecht werd-*.

<sup>6</sup>Cf. Holst (1974) for a more thorough discussion. For a discussion of similar problems with -*frei*, cf. Vögeding (1981).

### 5 On composition and derivation

From this lexical entry it will be explicitly clear in which respect *-gerecht* (28a) and *gerecht (werd-)* (28b) resemble one another and where they differ. The terminological dichotomy introduced by (14) contributes nothing at all to a better understanding of such subtle conditions as these.

### **3.4 Conclusion**

If one believes in a fundamental distinction between composition and derivation, such cases present a problem. They do not pose a problem for the strictly lexicalist "compositional theory of affixation": the semantic and distributional properties of the second constituent (the suffix) are registered in its lexical entry, as is the case for every other morpheme. Possible relationships to other entries can be found by comparing it to these lexical entries. Inasmuch as bound morphemes (morpheme complexes) differ from free morphemes semantically, one can account for this with the usual means of the lexical entry; the form of a lexical entry is flexible enough to capture precisely and adequately all the degrees of transition between bound and free morphemes, i.e., the transition between derivation and composition (often discussed in the literature). The categorial dichotomy free/ bound or composition/derivation is as such not capable of accomplishing this, neither is a three-way distinction like suffix/suffixoid/word.

It is consequently not at all necessary to differentiate formally between compositions and derivations of this type by means of special markings. There is no reason not to reduce the distinction composition/derivation to independently necessary differences in contextual restrictions described by the usual means of the lexical entry.

### **4 Similarity of prefixes to words**

That this gradual transition from a free to a bound morpheme is a completely natural phenomenon can also be seen from first constituents, where the same observation can be made. Morphemes like *-un* (*ungar* 'un-done'/"raw, not (yet) done"), *pseudo-* (*Pseudoargument* 'pseudo-argument') or *erz*- (*erzkatholisch* 'archcatholic', *Erzhalunke* 'arch-scoundrel'/"the ultimate swindler") occur only bound, therefore clearly as prefixes, whereas *blut* in *blútarm* 'blood-poor'/"anemic" (as opposed to *blútárm* 'blood-poor'/"bloody poor" with *blut-* a bound element here) and *Blutspur* 'blood-trace'/"blood spot" clearly corresponds to the freely occurring morpheme *Blut* 'blood'; in addition there is, however, a whole series of first constituents that in one respect are quite similar to free morphemes but

in another respect deviate semantically and/or distributionally in varying degrees from their free counterparts. This is true for, e.g., *haupt-, neben-* and *sonder*in (29a); for *bomben*- and *mords-* in (29b) (in addition we find a combination with a suffix; *mordsmäßig* 'murder-*s*-measure-y'/"terrific"); and for *lieblings-* in *Lieblingstheorie* 'darling-*s*-theory'/"pet theory":


All of the following show an especially close relationship to free morphemes: *grund-* in *Grundwortschatz* 'base-vocabulary'/"basic vocabulary" and *Grundvoraussetzung* 'base-requirement'/"basic requirement"; *zwangs-* in examples like *Zwangsschaltung* 'coercion-*s*-control'/"forced synchronization", *Zwangsbremsung* 'coercion-*s*-braking'/"forced braking", *Zwangsbelüftung* 'coercion-*s*-ventilation'/ "forced ventilation"; and *kunst-* in the sense of *künstlich* 'artificial', where *künstlich* itself is a combination of this nonfreely occurring first constituent with a suffix (*-lich*), so that, as in *mordsmäßig*, a combination of a prefix and a suffix results.

With prefixes as with suffixes we can account for that which the distinction composition/derivation correctly emphasizes, namely the differentiation of free and bound morphemes, by means of the usual distributional statements in their lexical entries. All further similarities and differences between morphemes that do not follow from the free/bound distinction are also accounted for automatically with all the necessary distinctions by the independently motivated means of the lexical entry.

5 On composition and derivation

### **5 Parallels between composition and derivation**

If one searches for other criteria that could support an essential distinction between composition and derivation (i.e., one not reducible to lexical properties), one will find only similarities instead of differences.

### **5.1 Inflection**

One characteristic property of compounds is that only the second constituent, not the first, can be inflected.

We therefore find *Haustüren* 'house-doors'/"front doors", not \**Häusertüren* 'houses-doors', and *kopfverletzte Kinder* 'head-injured children', not \**köpfeverletzte* 'heads-injured'. The same is true for derivations; we have, e.g., *Chefinnen* as the plural of *Chefin* "female boss", not \**Chefsin* or \**Chefsinnen* (although the plural of *Chef* 'boss' is *Chefs*), and there exists no \**köpfelose Kinder* 'heads-less children', but rather *kopflose* 'head-less (pl.)'.

### **5.2 Linking morphemes**

It is a well-known phenomenon that several (types of) first constituents in a compound require a "linking morpheme", such as the *s* in *Freiheitsstatue* 'freedom-*s*statue', *Haltungsschäden* 'posture-*s*-faults'. These same first constituents however require the very same linking morpheme before certain derivational suffixes: we find *freiheitsmäßig* 'freedom-*s*-measure-y'/"in regard to freedom" and *haltungslos* 'poise-*s*-less'/"unpoised" with *s*. Here we have on the one hand a similarity between compounds and derivations; on the other hand this criterion divides suffixes into two groups, one group similar to the determinatum of a compound and the other, not.

### **5.3 Elision in coordinate structures and phonology**

Under certain conditions the first or second constituent in coordinated compounds can be eliminated. Elision of the second constituent occurs in a construction which I term 'left deletion', cf. (30):

(30) a. Karl 'Karl liebt loves Herbstautumn und and (Heinz (Heinz liebt) loves) Frühlingsblumen spring-*s*-flowers' "Karl loves autumn flowers and (Heinz loves) spring flowers"

b. Karl 'Karl ist is denkthink und and (Heinz (Heinz ist) is) schreibfaul write-lazy' "Karl is sluggish in thought and (Heinz is) sluggish in writing"

Elision of the first constituent occurs in 'right deletion' structures as in (31):<sup>7</sup>

(31) Karl 'Karl verkauft sells Herrenmäntel man-*en*-coats und and -schuhe shoes' "Karl sells men's coats and men's shoes"

Left deletion can also be found in suffixal derivations as in (32) as well as in prefixal derivations in (33):

	- b. erkenn- 'recognize und and begreifbar comprehend-able' "recognizable and comprehensible"
	- c. Blatt- 'leaf und and Rankenwerk climber-*n*-work' "collection of foliage and tendril"
	- d. Film- 'film und and Theaterwesen theatre-being' "film business and theatre system"
	- e. Freund- 'friend oder or Feindschaft enemy-ship' "friendship or animosity"

b. Karl 'Karl hat has seinen his neuen new Mantel coat verkauft, sold nachdem after Heinz Heinz sich himself einen an alten old gekauft bought hat has'

<sup>7</sup>There are important differences between these two types of deletion, which we need not comment on here, however. They must be kept distinct from "elisions" of the type seen in (i):

<sup>(</sup>i) a. Die 'the neuen new Verträge contracts zeigen, show daß that der the alte old sehr very vorteilhaft advantageous war was' "The new contracts show that the old one was very advantageous"

<sup>&</sup>quot;Karl sold his new coat after Heinz bought himself an old one"

### 5 On composition and derivation

	- b. Ur- 'proto oder or Spätform late-form' "prototype or late type"

Right deletion in suffixal derivations is not easy to find because this presupposes that with the same first constituent two different suffixes have to be found that are comparable in function and for this reason can contrast in a coordinated structure, which is rare. One possible example is *eisenartige oder -haltige Materialien* 'iron-kind-y or contain-y materials'/"materials similar to or containing iron". Examples for prefixal derivations are easier to find, cf. (34):

	- 'head-entrances or exits' "main entrances or main exits"

In the same way that a linking morpheme, for instance *s*, must accompany certain suffixes but cannot cooccur with others (e.g., *anmutslos* 'grace-*s*-less', *freiheitsmäßig* 'freedom-*s*-measure-y'/"in regard to freedom", but only *anmutig* 'grace-y'/"graceful" and *freiheitlich* 'freedom-ly'/"liberal", never \**anmutsig*, \**freiheitslich*), we find that the elision of a suffix is not always possible; formations like (35) are excluded:



The fact that the suffix begins with a vowel cannot be the reason for this behavior, for formations like *farb*- und *lichtecht* 'colour and light-genuine'/"colourfast and fast to light" are fine, and (36) shows that certain suffixes beginning with a consonant are also not possible in left deletion constructions:


There is an unmistakable correlation here with certain phonological phenomena. The final voiced obstruent of the first constituent of a compound is subject to devoicing even when the second constituent begins with a vowel: the *d* in *Wanduhr* 'wall-clock' and in *kindähnlich* 'child-similar'/"child-like" is voiceless. Before suffixes like -*ig*, -*isch*, -*ung*, -*er* on the other hand it remains voiced: the *d* in *Windung* 'wind-ing'/"winding" and in *kindisch* 'child-ish'/"childish" is voiced. This however is not a general feature differentiating compounds from derivations, for this difference runs right through the class of affixes; before the suffix -*echt* a voiced obstruent becomes voiceless as the *b* in *farbecht* 'colour-genuine'/ "colourfast".

The same differential behavior of the different suffixes can also be found in syllabification phenomena concerning stems ending in a nasal. For instance, in the compounds *Regenauto* 'rain-car' and *regenähnlich* 'rain-similar'/"similar to rain", *regen* 'rain' in each case has two syllables, the second ending in [ən] or [ŋ]. Before the suffixes -*ung* and -*er* in *Beregnung* '*be*-rain-ing'/"irrigation" and *Beregner* '*be*-rain-*er*'/"irrigator", the stem-final nasal is obligatorily syllable-initial [n].

### 5 On composition and derivation

Before -*echt*, however, we find the stem having two syllables, as in *regenecht* 'raingenuine'/"rain-proof" with [ən] or [ŋ] in the second syllable, and never anything like \**regnecht* with syllable-initial [n].

Similarly for stems ending in *l*. In compounds like *Segelohren* 'sail-ears'/"elephant ears" we only find *l* as a non-initial part of the second syllable, whereas in derivations like *Segler* 'sail-*er*'/"yachtsman" and *Umseglung* 'circum-sail-ing'/ "circumnavigation" the *l* is (depending on idiolectal variation) either optionally or obligatorily syllable-initial. However, if one would suffix -*echt* to *segel*, the result *segelecht* 'sail-genuine' would obligatorily have *l* non-initially in the second syllable (although the exact meaning of the word would not be clear).

It is obvious that these properties of the different suffixes correlate also with the fact that before -*echt*, but not before -*ig*, *-isch*, *-in*, *-ung*, *-er*, a glottal stop can occur.

### **5.4 Boundaries**

We see that suffixes do not behave uniformly with regard to elision in left and right deletion: one group acts like elements of a compound, the other does not. With regard to possible syllabification, devoicing and the glottal stop suffixes act once again partially like elements of compounds, partially otherwise; and, as it seems, with the very same distribution that occurs with the elision phenomena (and apparently also with the possible occurrence of linking morphemes7a).

How is this to be described? First it is important to note that we are dealing here with unpredictable lexical properties of certain suffixes. One possibility that suggests itself is to make the operation of the relevant phonological rules as well as the deletion in right and left deletions dependent on certain boundary symbols in such a manner that the elements of compounds and suffixes like those in (32) as well as -*echt* begin with a "strong" boundary (#), while the suffixes in (35) and (36) begin with a "weak" boundary (+). The #-boundary would have largely the properties that are characteristic for the so-called word boundary: devoicing and syllabification occur typically in word final position, the glottal stop in word

<sup>7</sup>aThat is, "linking morphemes" in general seem to occur only when deletion, devoicing, etc. are possible. There is one exception, however. We have derivations like *vierblättrig* 'four-leaf-*r*y'/"having four leaves" and *zweirädrig* 'two-wheel-*r*-y'/"having two wheels". At first glance the -*r*- appears to be a plural suffix, witness *Blatt* 'leaf' vs. *Blätter* 'leaves' and *Rad* 'wheel' vs. *Räder* 'wheels'. This cannot be true, however, since we also have *einblättrig* 'one-leaf-*r*-y'/ "having one leaf" and *einrädrig* 'one-wheel-*r*-y'/"having one wheel". So the -*r*- has to be a kind of "linking morpheme", although -*ig* can neither be deleted nor begin with a glottal stop.

initial position.8,8a The phenomena of left deletion confirm this: in (37a) a whole syntactic word has been deleted under identity with an element of a compound, in (37b) the opposite has happened; an element of a compound has been deleted under identity with a syntactic word:

(37) a. professionelle 'professional und and Amateurschauspieler amateur actors'

"professional actors and amateur actors"

b. Amateur- 'amateur und and professionelle professional Schauspieler actors'

"amateur actors and professional actors"

One must nevertheless emphasize, that these results are to be evaluated with caution: Chisholm's analyses are dependent upon several highly hypothetical assumptions and his results are not as clear for all examples as one would like.

This could be tied to another problem. The postulation of different boundaries with different suffixes accounts for a number of non-trivial observations, but it also exposes a learnability problem with suffixes beginning in a consonant. None of the phonological processes which call for the distinction between # and + before a vowel are to be found before a consonant. How, then, does a speaker arrive at the judgement that the left deletions in (32) are fine but those in (36) are bad? Possibly positive evidence is necessary here; cf. note 8a. This could also explain why in some of these cases acceptability judgements are somewhat uncertain. (Note that the existence of stems like *Ros*- and *Hak*- which are bound to suffixes with weak boundaries (cf. Section 5.5) alleviates the learnability problem for certain cases, but does not offer a general solution.)

8aIf *-lich* and *-lein* are preceded by weak boundaries, then the rule(s) of devoicing must have recourse not only to # but also to +. Consider (i.a) and (i.b):


In Standard German a voiced obstruent (*d* and *g* in these examples) before *l* can be realized as such if both it and *l* are part of the same morpheme, as in (i). The obstruent must be devoiced, however, if the *l* belongs to a morpheme of its own, as in (ii). This fact removes the only possible phonological evidence for distinguishing # and + before consonants. This leads us to the conclusion that the language learner proceeds under the assumption that suffixes are introduced by weak boundaries, unless he is driven to postulate a strong boundary by positive evidence in the primary data. For suffixes beginning with a consonant (or *h*) the only positive evidence is furnished by deletions (and, presumably, "linking morphemes"; but cf. note 7a).

<sup>8</sup>Our classification of suffixes as wordlike and non-wordlike is, as Chisholm (1973; 1977) found, also largely substantiated by their metrical properties. Kiparsky (1975: 612–614; 1977: 223) subsumes this in his metrical theory, which makes essential use of boundary symbols, exactly as we do by differentially assigning them # and +.

### 5 On composition and derivation

If the occurrence of a glottal stop is essentially bound to #, then strong boundaries follow prefixes, for [ʔ] can always follow a prefix if a vowel follows; e.g., in *unerwünscht* 'un-desired'/"unwelcome", *verursach*- '*ver*-cause'/"(to) cause"; and if one forms words like *zerinformier*- '*zer*-inform' or *veroperier*- '*ver*-operate', where the main stress is on *ier*, the same regularity can be observed. Presumably this has to do with the fact that the element that follows a prefix can in general also occur as a word. I assume therefore that all morphemes which are not bound to a previous element begin with #. Left deletion as in (38a) with two prefixed verbs confirms this, and cases like (38b) do so even more, where a free word has been deleted under identity with the second constituent of a prefixal derivation (cf. Section 7):

	- b. Sie 'she möchte wishes ein-, in (aber) (but) er he möchte wishes entladen de-load' "She wants to load, (but) he wants to unload (s. t.)"

One can account for this by a redundancy rule for lexical entries.<sup>9</sup> If one also assumes the convention that at the end of a syntactic phrase (perhaps only with certain types of phrases) a # will be inserted, one obtains in a sentence a distribution of boundary symbols that is obviously adequate for the most part.

### **5.5 Nominal stems bound to the right**

The introduction of different boundary symbols (or an equivalent mechanism) proves to be useful in other connections as well.

A large number of nouns ending in -*e* appear in certain derivations without -*e*, e.g., *gedanklich* 'thought-ly'/"pertaining to thought" from *Gedanke* 'thought', *Äuglein* 'eye-*lein*'/"little eye" from *Auge* 'eye', and *Röschen* 'rose-*chen*'/"little rose" from *Rose* 'rose'. This does not justify a distinction between derivation and composition, for before suffixes like -*haft* and -*mäßig* it is not the *e*-less form of these nouns that one can observe, but rather the form that also appears in compounds: *rose*n*haft* 'rose-*n*-like'/"like (a) rose", *gedanke*n*haft* 'thought-*n*-like'/ "like (a) thought" but not \**roshaft, \*gedankhaft*.

A similar situation is found with many nouns ending in -*en*. From *Haken* 'hook', for example, we have *Häkchen* 'hook-*chen*'/"hooklet", from *Knochen* 'bone' we

<sup>9</sup>The only exceptions known to me are prepositions in combination with *dar*- 'there', *wor*- 'where', etc.: in *daran* 'there-at'/"at this", *worauf* 'where-on'/"on what", etc. [ʔ] is impossible.

have *knochig* 'bone-y'/"bony". Such forms without *-en* before *-ig, -chen*, and/or *-lein* are found, for example, with the words in (39):


Here again we have before other suffixes (e.g. -*haft, -mäßig*) the form which appears in compounds: *knoch*en*haft* 'bone-like'/*hak*en*mäßig* 'hook-measure-y'/ "in regard to hooks".

Nouns like *Rose* and *Haken* are unusual in that their first constituent (*ros-*, *hak-*) must occur before an element with a weak boundary. Insofar as these words are not idiosyncratic so that they would have to be listed as idiomatic morpheme complexes, the lexical entries for *Ros-* and *Hak-* could be formulated as in (40):

(40) a. PhC: *ros* KC: [*<sup>X</sup> <sup>0</sup>* [<sup>N</sup> #\_\_] [*<sup>X</sup> <sup>0</sup>* + *φ*] ] b. PhC: *hak* KC: [*<sup>X</sup> <sup>0</sup>* [<sup>N</sup> #\_\_] [*<sup>X</sup> <sup>0</sup>* + *φ*] ]

The behavior of a series of nouns ending in -*e* such as *Sprache* 'language' is similar to the case of *Rose* and yet differs in an interesting way. These nouns (as opposed to *Rose*, etc.) occur without -*e* in derivations and in compounds (in compounds sometimes optionally). Thus, we have *Sprachwissenschaft* 'language-science', *sprachbehindert* 'language-handicapped'/"linguistically deficient", *sprachlich* 'language-ly'/"linguistic", *sprachlos* 'language-less'/"speechless", *sprachmäßig* 'language-measure-y'/"in regard to language". The words of (41) display such a behavior:


5 On composition and derivation

For the cases which do not represent idiosyncratic combinations one could formulate a lexical entry as in (42):

$$\begin{array}{ll} \text{(42)} & \text{PhC:} & \text{sprach} \\ & \text{KC:} & \left[ \text{ $\chi$ ^{\circ} $ [1 \#\\_]} \left[ \text{$ \chi $^{\circ}$  [\rho]} \right] \right] \end{array}$$

The notations (40) and (42) will have to be supplemented with a convention that states (opposite to what we find in phonology): a weaker boundary may also occur in the place of a selected boundary, but a stronger boundary may not.9a

### **5.6 Argument inheritance**

A phenomenon which upon first glance seems to be appropriate to establish an essential distinction between composition and derivation is what Toman (1980) terms "argument inheritance". This means that, for example, a verb has selectional properties which in the case of derivation are typically passed on to the derivation. Thus, the subject of a regular *-bar* formation and the genitive or *von*phrase of a *-ung* or *-er* derivation correspond to the accusative object of a transitive verb.

Thus, the genitive object of (43b) corresponds to the accusative object of (43a). In the case of compounds, however, the first constituent cannot in general pass on its "arguments" to the compound; the genitives in (43c,d) are excluded:

<sup>9</sup>aIf the approach embodied in (40) and (42) is correct this implies that truncation rules in the sense of Aronoff (1976) do not exist. That is not to deny the existence of haplology, of course. German has a suffix forming feminine action-nouns from verbs that shows up as -*ei* after verbal stems ending in [ər] or [əl], as in (i); with all other verbs it shows up as -*erei*, as in (ii):


See also (53). With verbs of group (ii) -*er*- cannot be left out; with those of group (i.a) -*er*- is impossible. With (i.b) variants like *Bimmlerei, Seglerei* are marginally possible. The absence of -*er*- in (i) may well be due to a kind of haplological simplification.

	- b. die 'the Prüfung check-ing [of] des the Systems system' "the check of the system"
	- c. der 'the Prüfvorgang check-process ( ([of] \*des the Systems) system)' "the checking procedure (of the system)"
	- d. der 'the Prüfungsvorgang check-ing-*s*-process ( ([of] \*des the Systems) system)' "the checking procedure (of the system)"

Similarly (44b) corresponds to (44a) but not (44c):

	- b. die 'the Beobachtung observe-ing [of] der the Vorgänge processes' "the observation of the proceedings"
	- c. der 'the Beobachtungsturm observing-*s*-tower ( ([of] \*der the Vorgänge) processes)' "the observation tower (of the proceedings)"

This is the typical situation. Upon closer examination, however, it can be seen that this is not as general as seems the case. The genitive in (45a) is apparently inherited from the first constituent of the compound, cf. (45b,c):

	- b. die 'the Beschleunigung acceleration [of] der the Partikeln particles'
	- c. \* der 'the Grad degree [of] der the Partikeln particles'

(46a) is somewhat more difficult. This expression corresponds in its meaning to (46e) and (46b). (46b) is however syntactically ambiguous: the genitive *der Pflanzen* can be related formally to either *Wachstum* or *Geschwindigkeit des Wachstums*. The relative clauses in (46c,d) indicate that semantically only the reference to *Wachstum* is possible; for this reason I assume that in (46a) the first constituent of the compound has passed on its argument to the compound:

5 On composition and derivation

	- b. die 'the*fem.* Geschwindigkeit speed [of] des the*neut.* Wachstums growth [of] der the Pflanzen plants'
	- c. die 'the*fem.* Geschwindigkeit speed [of] des the*neut.* Wachstums, growth das that*neut.* die the Pflanzen plants aufweisen show'
	- d. ⁇ die 'the*fem.* Geschwindigkeit speed [of] des the *neut.* Wachstums, growth die that*fem.* die the Pflanzen plants aufweisen show'
	- e. die 'the*fem.* Geschwindigkeit, speed in in der which*fem.* die the Pflanzen plants wachsen grow' "the speed at which the plants grow"

There are a number of unclear cases. (47a) does not appear to me to be fully acceptable; nevertheless it is far better than (47b):<sup>10</sup>

	- b. \* das 'the Wartezimmer wait-*e*-room auf on den the Arzt doctor' "the waiting room for the doctor"

We can see that in certain cases the inheritance of arguments is also possible in a compound. The conditions under which this occurs are not clear. I would like to suggest that on the one hand certain semantic regularities play an essential role, on the other idiosyncratic properties of the second constituents involved.

On the other hand, even in derivations the inheritance of arguments from the first constituent is not always possible. With adjectives as in (48b,d) the reason could simply be that, in general, there are heavy restrictions on the occurrence of complements to adjectives, especially when in the genitive:

(48) a. die 'the Verfolgung pursue-ing [of] der the Täter doers'

"the pursuit of the committers (of the crime)"

<sup>10</sup>The examples (44), (45), (47) are gleaned from Toman (1980).


With nouns as in (49b) the reason must be that the suffix blocks the inheritance of the genitive object:

	- b. die 'the*sg. fem.* Sängerschaft singer-ship ( ([of] \*der the Arie) aria)'
	- c. die 'the Erzieherschaft educator-ship [of] meiner my Kinder children' "the guardianship of my children"

Even in (49c) the genitive is not to be interpreted as a genitive complement (to *Erzieher*) but rather as a possessive (or perhaps even as a subjective) genitive (to *Erzieherschaft*).

A similar situation seems to hold for the suffix -*tum* (which one can use to create new words, although one seldom does). Along with (49a) we have (50a) (where *Singen*, contrary to its appearance, is most likely not a noun, cf. Section 10) and (50b), but not (50c):

	- b. sein 'his Sängertum singer-dom' "his singerhood"
	- c. \* sein/das 'his/the Sängertum singer-dom [of] der the Arie aria' "his/the singerhood of the aria"

While the genitive complements in (51) are fine, they appear to me to be more than dubious in *-chen*-derivations from the very same nouns in (52):

5 On composition and derivation

	- b. der 'the Überwacher over-watch-*er* [of] des the Verkehrs traffic' "the traffic supervisor"
	- b. das 'the Überwacherchen supervisor-*chen* ( ([of] \*des the Verkehrs) traffic)' "the little supervisor (of the traffic)"

And with deverbative nouns ending in *-(er)ei* prepositional complements as in (53a,b) appear to me to have approximately the status of (47a) while genitive complements and corresponding prepositional phrases with *von* appear to be excluded:

	- b. die 'the Sucherei search-ing (?nach ( for "authentischen" "authentic" Belegen) documentations)' "the searching around (for "authentic" documentations)"
	- c. die 'the Fahrerei drive-ing ( ([of] \*solcher such Wagen) cars)' "the driving around (of such cars)"
	- d. die 'the Überwacherei supervise-ing (⁇von ( of kleinen little Verbrechern) criminals)' "the surveillance (of minor criminals)"
	- e. die 'the Singerei sing-ing (\*von ( of Arien) arias)'

Although the judgements of individual examples are not always entirely certain, one thing is sure: in considering argument inheritance we are not dealing with a problem that categorially distinguishes between composition and derivation. Rather it is dependent on the idiosyncratic and/or the semantic properties of the second constituents of word formation constructions. If this is true, it is exactly what is to be expected from a strictly lexicalist theory of word formation.

### **6 Synthetic compounds**

A variety of interesting theoretical questions arise in connection with a special type of word formation, the so-called synthetic compounds.<sup>11</sup> These (in my interpretation) contain compounds which do not occur freely as a word (as we expect of ordinary compounds), but rather only as a constituent of another word.

### **6.1 Affixal synthetic compounds**

Formations such as (54) belong here:


They have not been formed with the adjective *lustig* 'pleasure-y'/"cheerful, comical", the meaning speaks against this: someone who is 'streitlustig' is not necessarily cheerful or comical. Neither would it be correct to analyze *lustig* as a suffix; it is clearly reducible to the components *-ig* as an adjectival suffix and *lust* in one of the meanings that the noun *Lust* can have, namely 'desire': someone who is 'streitlustig' is belligerent, desiring a fight, and someone who is 'baulustig' has the wish to build a home. One way to describe this relationship is to analyze it as a -*ig*-derivation from a compound *Baulust* which, however, only occurs in this derivation; just like the similar formation *arbeitswütig* 'work-*s*-anger-y'/"mad

<sup>11</sup>In German various terms are in use here, among them *Zusammenbildung* 'together-formation'. This most frequently used term appears to me quite appropriate because its literal meaning is as unclear as the essential properties of the construction itself. The occasionally used term *Wortgruppenableitung* 'word-group-derivation' is misleading inasfar as it suggests the identification of, e.g., *braunäug*- brown-eye' in *braunäugig* "having brown eyes" with the syntactic group *braune Augen* 'brown eyes'. The differences are, however, far-reaching.

5 On composition and derivation

with work" can be understood as a derivation from the free compound *Arbeitswut* 'work-*s*-anger'/"work rage".11a

This type of formation is very popular, e.g., with expressions of quantity (quantifiers and cardinal numbers) as the first component of the compound (55) or with an ordinal number or a normal adjective (56):11b,12

The situation is in fact slightly more complex in that *lustig* in the sense of 'having the desire to' does occur as a syntactic word in expressions like (i), pointed out to me by Susan Olsen:

(i) Sie 'she macht makes nur, only wozu where-to sie she lustig desire-y ist is' "She only does what she wants to"

This use of *lustig* appears to be restricted to relative clauses of the form *wozu x lustig sei-*. It seems that all speakers who use words of the pattern (54) do not use this idiomatic expression, so it can hardly be causally involved in the establishment of (54).

	- (i) *innerdeutsche, innerenglische, innerliberale, innerlinke (Vorgänge)* 'inner-German, inner-English, inner-liberal, inner-left (proceedings)'/"(proceedings) within Germany, England, the liberal wing, the left wing"
	- (ii) *die deutsche/liberale Zusage, mehr Waffen zu liefern* 'the German/liberal promise to deliver more weapons'

<sup>11</sup>aThere are speakers who find *Baulust*, *Kauflust*, *Reiselust* and some others quite unobjectionable. This is just what one would expect, given the possibility of compounding. The remarkable fact is that such free compounds are, to varying degrees, less than fully acceptable for many speakers. This constitutes what I term the distributional problem of synthetic compounds in Section 6.3.


### 5 On composition and derivation


### **6.2 Synthetic compounds within compounds**

One could suspect bound compounds to be particular to derivations, constituting a criterial distinction between (suffixal) derivation and composition. In reality, however, each one of these constructions that is in any way accessible to comparison has a parallel in constructions whose second component is a free element and not a suffix:


The examples in (57) have the same first constituents as *fünfachsig, Fünfachser*, etc. and they are bound to the second constituent in (57) in the same way they are in (55). (Especially noteworthy are cases like *Allwetterflugzeug* 'all-weatherairplane'/"all-weather airplane" and probably also *allstündlich* 'all-hour-*ly*'/ "hourly" in whose paraphrases *jed-* instead of the expected *all-* occurs: *Flugzeug für jedes/\*alle(s) Wetter* 'airplane for every (kind of) weather', *jede/\*alle Stunde* 'every hour'.) On the other hand the first constituents of *einäugig* 'oneeye-y'/"one-eyed", *zweibeinig* 'two-leg-y'/"two-legged", and *Zweibeiner* 'two-leg*er*'/"being having two legs", for example, also occur freely: one can refer to a person as *Einauge* 'one-eye'/"person having (only) one eye" or *Zweibein* 'two-leg'/

"person having two legs"; cf. also *Dreirad* 'three-wheel'/"tricycle" and *Einbaum* 'one-tree'/"canoe made from one piece of log".

The first constituents of compounds like those in (58) are constructed like the first constituents in (56) and are bound in both cases:12a


Examples like (59), in contrast, have the same form as these first constituents but are not bound:


<sup>12</sup>aHowever, I recently came across *Großraum* used in the sense of 'large room'. (*Großraum* in the sense of 'extended (urban) area' has been well-established for a long time.) This may be a kind of backformation from *Großraumbüro* 'large-room-office'/"(typing) pool". – In the technical language of athletics, *Langstrecke* "long distance", *Kurzstrecke* "short distance" can sometimes be heard, presumably from *Langstreckenlauf* 'long-stretch-run'/"long-distance race", etc. – Recall also the remarks in note 11a.

### 5 On composition and derivation


### **6.3 Two problems**

If one analyzes such synthetic compounds as having a compound as the first constituent, as I do, two problems arise.

I would like to term the first problem the distributional problem. It arises in a similar fashion in all theories, but does not even receive recognition as a problem in the literature known to me. It is the question of why these first constituents do not generally occur in free form. Why do, for example, *fünfachsig, Fünfachser, Fünfachslastzug* occur, but not \**Fünfachse*? On the one hand, completely idiosyncratic restrictions cannot be the entire reason since this word formation pattern is unusually productive. On the other hand I have emphasized that formations of the type \**Fünfachse*, etc. do indeed exist freely, cf. (59).12b It is not the goal of this article to solve the distributional problem.

The second problem is of more formal nature; it can best be discussed by turning to an example. One instance of the pattern illustrated in (56a) is *langfädig* 'long-thread-y'/"having long threads", one component of which is related to *Faden* 'thread'. According to our discussion it should have the constituent structure of (60):

(60) [<sup>A</sup> [<sup>N</sup> [<sup>A</sup> #*lang*] [<sup>N</sup> #*fäd*]] [A +*ig*] ]

Moreover, the nominal element *fäd* should have the categorial characterization (61), parallel to (40b):

(61) [*<sup>X</sup> <sup>0</sup>* [<sup>N</sup> #\_\_] [*<sup>X</sup> <sup>0</sup>* + *φ*] ]

This means that *fad* is bound to a subsequent element *φ* with a weak boundary and that *φ* should be a sister constituent to *fad*. This condition is, however,

<sup>12</sup>bTo be more exact, examples with expressions of quantity like \**Fünfachse* that occur freely seem to always be semantically exocentric, like *Einauge, Dreirad, Dreifuß* 'three-foot'/"tripod", etc. (Some possible exceptions, pointed out to me by Jürgen Lenerz, are: *Dreisprung* 'threejump'/"hop, skip, and jump", *Mehrkampf* 'several-competition'/"allround competition", *Dreiklang* 'three-tone'/ "triad".) One would hope to find general principles from which this follows. The restrictions with normal adjectives illustrated in (56) and (58) seem much more mysterious, since there are large numbers of (semantically endocentric) examples like (59).

not fulfilled in (60). It is not *fäd* but *langfäd* that has the desired right sister constituent.13,13a This does not, however, imply that either (60) or (61) has to be abandoned. As we will discuss more closely in Section 8, the productive compounding rule for German states that the grammatical properties of a compound are determined by the grammatical properties of its final component. This means in this case that the compound *langfäd* takes over from its final component *fäd* the categorial characterization (61) and hence must be bound to an appropriate element. One can assume that for exactly this reason *fäd* itself is not subject to the restriction (60). This restriction has been transferred over to the compound, so to speak. Under this assumption (61) does not contradict (60).

If (60) is correct, a problem could arise with left deletion. In such constructions sequences which stand between two strong boundaries are deleted; the resulting gap does not have to be a constituent. In (62) for example, the deleted sequence *Lösung ein* is not a constituent:

<sup>13</sup>Williams (1981) proposes a variant of the strictly lexicalist theory in which this problem does not occur: he does not use analyses like (60) but instead would assume a compound of *lang* and *fädig*. Such a grouping is not excluded on formal principles but it violates the principle of strict semantic compositionality (cf. note 13a): the meaning of *lang* 'long' would have to combine with that of *fädig* (presumably: 'having threads') to that of *langfädig*. In view of this it is worthwhile to explore the consequences of a strictly compositional analysis like (60); all the more since Williams does not present convincing reasons for his analysis. He simply finds support in a grammatical tradition according to which a strong boundary may never occur inside a weaker boundary in English. However, on the one hand, the criteria for the identification of different boundaries in English are not unproblematic in nature, cf. Strauss (1979) (and at any rate not identical with the criteria that we have used for German). On the other, it is not at all evident that this grammatical tradition is empirically well-founded.

<sup>13</sup>aSince one of the main motivations for my account of synthetic compounds is the principle of strict compositionality, some comments may be in order.

We must distinguish between 'compositional' and 'strictly compositional'. An expression *E* is semantically compositional if its meaning is completely determined by the semantic and the syntactic properties of the parts of *E* (and, perhaps, prosodic properties of *E*) according to general rules. *E* is semantically strictly compositional if only the semantic and the syntactic properties of the immediate constituents of *E* enter into the determination of *E*'s meaning. It is an empirical fact that non-idiomatic expressions of natural languages are compositional, but it is obviously not the case that all non-idiomatic expressions are strictly compositional.

A rather unusual type of violation of strict compositionality is illustrated in (i):

<sup>(</sup>i) Weil 'because es it jedoch however lange long nicht not geregnet rained hat, has, ist is der the Boden soil ausgetrocknet parched' "However, because it hasn't rained in a long time the soil is parched"

5 On composition and derivation


No problem results from this if left deletion is formulated as the deletion of a variable. If one, however, assumes that left deletion deletes a constituent in each case (iteratively, where appropriate), (62) would have to have the intermediate stage (64) and (63), the intermediate stage (65), and this is unacceptable:

(64) Karl 'Karl tritt steps für for die the große great Lösung solution und and Heinz Heinz tritt steps für for die the kleine small Lösung solution ein in'

"K. pleads for the large solution and H. pleads for the small solution"

(65) \* langfäd- 'long-thread oder or kurzfädig short-thread-y'

(ii) Der 'the Boden soil ist is ausgetrocknet, parched weil because es it (\*jedoch) (however) lange long nicht not geregnet rained hat has'

Here *jedoch* 'however', which is contained in the clause introduced by *weil* 'because', has semantic scope over the entire sentence, i.e., the meaning of *jedoch* does not enter into the determination of the meaning of the *weil*-clause, and the meaning of the entire sentence is determined in part by *jedoch* although it is not an immediate constituent of the sentence. A *weil*-clause cannot contain *jedoch* if it is not in the Vorfeld (i.e., in front of the finite verb *ist*). Example (ii) is unacceptable with *jedoch*:

We also find violations of strict compositionality in complex words. For instance *langgeschwänzt* 'long-*ge*-tail-*t*' means 'having (a) long tail'; its immediate constituents are the free elements *lang* 'long' and *geschwänzt* "having (a) tail". Under common assumptions about rules for building up semantic representations there is no way to get "having a long tail" from "long" and "having a tail". The theory of Williams (1981) will have no problem with *langgeschwänzt* because it denies the relevance of the principle of strict compositionality in word formation. However, given the fact that constructions like *langgeschwänzt* are rare and felt to be rather obsolete (as opposed to *langschwänzig*, with the same meaning) and that, in general, violations of strict compositionality appear to fall into a few closely defined types, it seems advisable to make every effort to save the principle of strict compositionality wherever possible.

Just how important this fact is for the analysis (60) cannot be discussed further here; it is, however, not evident that (60) is refuted by this.<sup>14</sup>

### **6.4 Conclusion**

When binary constituent structures are assumed for synthetic compounds there are always unfavorable consequences in the application of the usual definitions, such as with (14). If one isolates in *fünfachsig* and *Fünfachslastzug* the compound *fünfachs*, this does not occur freely; therefore both are derivations. (The same can be said if one considers *fünf* as an immediate constituent of the word; since *achsig* or *Achslastzug* do not occur freely they would again be derivations according to (14).) These bound morpheme complexes are, however, different from normal prefixes in that they derive from productive word formation processes (involving only free elements); this is exactly the characteristic distributional problem of the synthetic compounds.

We have seen that there are complicated relations between the free and bound occurrence of morphemes (or morpheme complexes) and that the terminological division into composition and derivation is in no way at all helpful in handling this. In addition, it must be recognized that entirely apart from the problems they pose in derivations (as *fünfachsig*), synthetic compounds exist and are interpretable in compounds (as *Fünfachslastzug*). Derivations and compounds follow the same regularities here, so that once again the relationship between composition and derivation has been demonstrated in a rather peculiar case.


<sup>14</sup>This kind of problem is well-known from the discussion of different deletion operations suggested in the literature. One would like, for instance, to derive (i) from (ii) for syntactic and semantic reasons:

5 On composition and derivation

### **7 The verbal complex**

I would like to bring attention to a special type of synthetic compound which is generally overlooked in the literature: formations such as *aufschlüsselbar* 'openkey-able'/"capable of being itemized", *Aufschlüsselung*, 'open-key-ing'/"itemization". They are usually not recognized as synthetic compounds because elements like *auf* are regarded as verbal prefixes. In fact they are not prefixes at all. They occur as syntactic words. For ease of exposition I will assume here that they belong to a syntactic category VZ ('Verbzusatz'/'converb').

### **7.1 VK as a constituent**

Frequently converbs form a constituent together with the (finite or infinite) verb which I will call the verbal complex (VK), for example in (66), (67) and (68):

	- b. weil 'because Karl Karl den the Plan plan durchführt through leads' "because Karl carries our the plan"
	- c. weil 'because Karl Karl Heroin heroin ausführt out leads' "because Karl exports heroin"
	- b. Karl 'Karl hat has den the Plan plan durchgeführt through led' "Karl has carried out the plan"
	- c. Karl 'Karl braucht needs das the Heroin heroin nicht not auszuführen out to lead' "Karl need not export the heroin"


The fact that the converb and the verb in (68) are found together in the Vorfeld (in front of the finite verb) is a strong indication that they in fact form a constituent. The verb cannot occupy the Vorfeld without its VZ, as (69) demonstrates:

	- b. \* Geführt 'led hat has Karl Karl den the Plan plan durch through'
	- c. \* Zu 'to führen lead braucht needs Karl Karl das the Heroin heroin nicht not aus out'

Apparently the Vorfeld cannot be occupied by V (or by a *X 0* constituent generally, if *X 0* is not a maximal projection by itself) but only by VK (or another *X n* constituent, n*>* 0); even in cases like (70) one will have to analyze the verb in the Vorfeld as representing a VK:

	- b. Gebracht 'brought hat has Karl Karl den the Bullen bull' "Karl brought the bull"

Also in gapping the combination VZ ͡ V proves to be a constituent. (71a-c) where no combination with a VZ occurs are generally acceptable:

	- c. Karl 'Karl führt leads Heroin heroin aus out und and Heinz Heinz Marijuana marijuana ein in' "Karl exports heroin and Heinz imports marijuana"

5 On composition and derivation


But (71d) which entails a VZ ͡ V sequence is excluded (for many speakers); (71e) in which the whole sequence has been deleted, on the other hand, is fine. From this we can at least conclude that VZ ͡ V forms a constituent (that is distinct from VP).

### **7.2 Immediate constituents of VK**

That such sequences are to be analyzed into two immediate constituents and do not form as a whole one verb follows from the convergence of phonological (prosodic), morphological and syntactic differences that exist between sequences of this kind and sequences that clearly form one word.

**7.2.1** The first constituent is stressed more strongly than the second in sequences with VZ. This is normal and follows from the rule that within verbal expressions a subsequent constituent is always more weakly stressed than the preceding one. For this reason, sequences without complements are fully stressed, cf. (72a);<sup>15</sup> if a complement appears, it carries the primary stress (72b); the same goes when more than one complement is present (72c):

	- b. i. weil 'because Karl Karl gerne gladly T 1 ausendfüßler thousand-foot-*ler* 2 ißt eats' "because Karl likes to eat centipedes"

<sup>15</sup>The numbers indicate, following Chomsky & Halle (1968), the relative prominence of stress: the smaller the number the stronger the stress.

The 'stress rule' alluded to in the text is, of course, exceedingly oversimplified. The stress assignments given in (72) do, however, represent the essential features of so-called normal stress. For an explication of this concept, cf. Höhle (1982a).

	- ii. weil 'because Karl Karl häufig often nach to M 1 ünchen Munich gefl<sup>2</sup> ogen flown w 3 ird becomes' "because Karl is often flown to Munich"
	- iii. weil 'because Karl Karl [to] der the Schwester nurse die the H 1 and hand auf on die the Br2 osche brooch l 3 egte laid' "because Karl put his hand on the nurse's brooch"

Within the verb the situation is exactly the opposite. In comparable morphological sequences which are clearly one word, the second constituent, the verbal stem, carries in general a stronger stress than the first, cf. (73):

	- b. weil 'because Karl Karl [to] dem the Kerl fellow ùnterlág under-lay' "because Karl was defeated by the fellow"
	- c. weil 'because Wolken clouds den the ganzen entire Himmel sky ǜberzíehen over-pull' "because clouds are spreading over the entire sky"
	- d. weil 'because Karl Karl die the Kiste box dùrchsúcht through-searches' "because Karl searches through the box"

**7.2.2** The inflectional prefix *zu* occurs directly before the infinite verb. With the verbs of (73) we therefore get, e.g., *weil er es zu ùntertáuchen versucht* 'because he

### 5 On composition and derivation

it to under-dive tries'/"because he tries to swim under it". The prefix *ge* cannot occur here because it is bound to the position before primary stress, cf. Kiparsky (1966). In the sequence VZ ͡ V, on the other hand, *zu* und *ge* occur naturally in front of the verb and not before VZ; we therefore find (74a) but not (74b):15a

	- ii. weil 'because Karl Karl den the Plan plan durchzuführen through to lead scheint seems' "because Karl seems to carry out the plan"
	- b. i. \* weil Karl das Heroin geausführt hat
		- ii. \* weil Karl den Plan zu durchführen scheint

**7.2.3** Above all, however, it is the verb alone of a verbal complex without the VZ which is subject to the syntactic rules of the placement of the finite verb, cf. (75):

(75) a. Karl 'Karl führt leads Heroin heroin aus out' "Karl exports heroin"

b. \* Karl ausführt Heroin

Morpheme sequences of the type (73) however are, as one expects of words, only permutable as wholes, cf. (76a) vs. (76b):

	- 'Karl under-lay'
	- "Karl was defeated"
	- ii. Wolken 'clouds ǜberzíehen over-pull den the Himmel sky'
		- "Clouds are spreading over the sky"
	- b. i. \* Karl lág ùnter
		- ii. \* Wolken zíehen den Himmel ǜber

<sup>15</sup>aIt seems natural to assume that *tauch*-, which is a free verbal stem, is a V<sup>0</sup> even when contained in a prefixal derivation like *ùntertáuch*- 'under-dive'/"swim under (something)". If so, *zu* and *ge* must not be placed before the minimal V<sup>0</sup> contained in V<sup>0</sup> but rather must prefix to a maximal V 0 . VZ ͡ V cannot be a V<sup>0</sup> , under these assumptions.

### **7.3 Conclusion**

All these phenomena follow naturally from the assumption that VZ ͡ V sequences do not form a constituent of the type V<sup>0</sup> (in this case we would have compounded or derived verbs), but rather one of the type V<sup>1</sup> (= VK). I therefore postulate a phrase structure rule like (77) for German:

$$\begin{aligned} \text{(77)} \quad & \text{VK} \rightarrow \left( \left\{ \begin{array}{c} \text{VK} \\ \text{VZ} \end{array} \right\} \right) \text{v} \end{aligned} $$

It generates on the one hand combinations of VZ and V and on the other (by means of the recursive introduction of VK) verbal sequences like *(weil Karl den Hund) geschenkt gekriegt zu haben scheint* '(because Karl the dog) donated received to have seems'/"because Karl seems to have received the dog as a present"; cf. Höhle (1978: 78f.).

What is remarkable about the VZ ͡ V complexes in the analysis is not so much their syntactic behavior as the fact that they are so highly idiomatic. The meaning of *áussèh*- 'out look'/"look in appearance" or *(sich) vórsèh-* '(oneself) before look'/ "take care of oneself" does not come about regularly from the meaning of the converb and the verb. Furthermore, several verbs exist only in connection with VZ; e.g., *bürger-* only occurs with *ein* (meaning 'naturalize') and *aus* (meaning 'expatriate'), and *schlüssel-* occurs only with *auf*.

Since VZ ͡ V sequences according to this discussion do not occur freely as words (but rather, where this appears to be the case, always form a syntactic phrase of the type VK), formations like *Aufschlüsselung* and *aufschlüsselbar* must be considered synthetic compounds with the constituent structure of (78):15b

<sup>15</sup>bBound compounds like *aufschlüssel-* occur before other suffixes as well, of course; e.g., *Aufschlüsselei* "itemizing" (cf. note 9a), *Aufschlüßler* "person who itemizes". They can also occur as first components of compounds, as in *Aufschlüsselvorschrift* 'itemize-instruction'/"instruction for itemizing". Examples are numerous; e.g., *Abhöraffaire* 'from-hear-affair'/"bugging affair", *Abziehbild* 'from-tear-picture'/"transfer-picture", *Anziehsachen* 'at-tear-things'/"clothes", *Aufputschmittel* 'on-putsch-means'/"inciting drug", *Aufblasvorrichtung* 'on-blow-device'/"device for blowing up", *Aufschäumtechnik* 'on-foam-technique'/"technique of foaming up", *Durchhaltevermögen* 'through-hold-*e*-ability'/"power of endurance". However, nominalizations like *Aufschlüsselungsvorschrift* 'itemizing-*s*-instruction'/"instruction for itemizing" are often preferred.

Formally it would be possible to analyze *Aufschlüsselung* as composed of *auf* and *schlüsselung*. The main reason for preferring (78) is once again strict compositionality: if *schlüsselung* were a constituent, it would receive no interpetation, since the verb *schlüssel-* has no meaning by itself. Hence, the whole word could have no meaning either under a strictly compositional assignment of meaning.

The distributional problem of synthetic compounds reappears here, of course: why can the compound *aufschlüssel-* not occur as a free element? With verbs, however, this problem is much

5 On composition and derivation

(78) a. [<sup>N</sup> [<sup>X</sup> <sup>0</sup> [VZ auf] [<sup>V</sup> schlüssel] ] [<sup>N</sup> ung] ] b. [<sup>A</sup> [<sup>X</sup> <sup>0</sup> [VZ auf] [<sup>V</sup> schlüssel] ] [<sup>A</sup> bar] ]

The constituent *X 0* is a compound which does not occur freely; due to the regularity of composition (cf. the following section) *X* = V so that the selectional properties of *-ung* and *-bar* are not violated.

### **8 The regularity of composition**

The previous sections have made it clear that there are no fundamental differences between composition and affixal derivation which would render support for assigning them different types of constituent structure. Up until now we have not discussed how the categorial classification of a bound morpheme can be determined. A simple observation is important here.

In German compounds there is an asymmetry in the function of the components of the compound which I term the 'regularity of composition'. The syntactic category of a compound is completely determined by the second component in that it is identical with that of the second component. The first component, on the contrary, exerts no influence in this sense. Thus, the noun *Käfig* 'cage' can be combined with the noun *Tiger* 'tiger' to form *Tigerkäfig* 'tiger cage', with the adjective *groß* 'large' to form *Großkäfig* 'large cage' and with the verb *wohn*- 'live' to form *Wohnkäfig* 'living cage'; the compound is in each case a noun of the same category as *Käfig*. With respect to the inflectional and the most important distributional properties of the word the first component could be omitted without changing anything. The second component is in complete agreement with the compound in these points. In this formal syntactic sense compounds are always endocentric.

There is a comparable asymmetry with derivations. Within a derivation the first component exerts no influence upon the syntactic category of the structure. This is determined exclusively by the second component. It is irrelevant whether the first component is a prefix or a free element. Prefixes do not alter the syntactic category in principle and, since many of them combine with several different

more general; verbal compounds of any type are not freely used at all in German. (There is a very restricted way of using expressions that look like verbal compounds. These are mostly backformations of the type *uraufführ-* "play for the first time" and *bauspar-* "invest into a building society", briefly remarked upon in Höhle (1978: 34). This phenomenon has so far defied any theoretical interpretation.)

Note that the bound compound *aufschlüssel* in *Aufschlüsselung* does not have the stress pattern of derivations as in (73) but has main stress on the VZ. It follows that the stress rules operating within V<sup>0</sup> are able to distinguish between free VZ and bound verbal prefixes.

categories, the resulting category is not predictable on the basis of the prefix.<sup>16</sup>

If the first component of a derivation is not a prefix it is a free element (or a bound compound as with synthetic compounds); the second component is then not a word but a suffix. The category of the derivation is determined entirely by the suffix. Thus, an adjective like *grün* 'green', a noun like *Glück* 'fortune' or a verb like *begreif* - 'comprehend' may combine with -*lich*; the resulting words *grünlich* "rather green", *glücklich* "happy", *begreiflich* "comprehensible" are all adjectives. Combined with -*er* we have the noun *Eigentum* 'property' as in *Eigentümer* "proprietor" and the verb *bewohn*- 'inhabit' as in *Bewohner* "inhabitant", where the derivation is always a noun. The suffixes which derive nouns determine at the same time not only the category of the derivation but also its inflectional class and its gender.

These properties of suffixes are extremely mysterious if one postulates "rules" like (12); they are completely natural if we assume that suffixes have their own syntactic category just like other morphemes (morpheme complexes). This idea is especially plausible with nominalizing suffixes. Non-complex nouns differ from the members of the other categories among other things in that they have a nonvariable, unpredictable gender. The gender of nouns ending in *-ung*, etc. is however predictable, namely on the basis of the suffix; nouns in *-ung* are feminine, nouns in *-er* are masculine, nouns in *-chen* are neuter. It is completely consistent to state that this gender is inherent to the respective suffix. If this is true, then one can sensibly consider the suffix itself to be a noun, just like a word such as *Tag* 'day' is sufficiently characterized as being a noun by the fact that it has inherent gender (namely, masculine). The same considerations hold with respect to the inflectional category typical of nouns. From the simple regularity that the second component determines the category of the whole it follows automatically that a deverbative word ending in *-ung*, since *-ung* is a noun, is likewise a noun, while

<sup>16</sup>This holds, as was emphasized in the beginning, for adjectives and nouns. The situation appears to be different with verbs: prefixes like *ent*- 'de-' (*entkern*- 'destone'/"stone") and *be*- (*berohr*- '*be*-pipe"'/"supply with (a) pipe") are usually considered verbalizing prefixes, with the implication that the second component is to be marked N and not V. This seems to me very dubious for several reasons. These derivational processes are presumably much more complex. In particular I assume that direct denominal formations similar to participles of the type *behaart* '*be*hair-*t*'/"having hair", *beschuht* '*be*-shoe-*t*'/"wearing shoes", *enteisent* 'de-iron-*t*'/"deferrized", *verwanzt* '*ver*-bug-*t*'/"buggy" (for which there are no verbs \**behaar*-, \**verwanz*-, etc. in general use) are largely underestimated in the systematic role they play. While derivations with such prefixes evidently need not be verbs, prefixes are not needed to derive verbs either. In a substantial number of verb formations direct shifts in category can be observed, as in *miau*- '(to) meow' from an onomatopoetic expression *miau* of dubious category (cf. *die Katze macht "miau"* 'the cat does meow') and *barzel*- "behave like Barzel" (Mr. Barzel is a German politician). It can be seen from these facts that the role of prefixes in the formation of verbs is not nearly as unproblematic as is commonly assumed.

### 5 On composition and derivation

all words ending in -*lich* are adjectives because -*lich* is an adjective. Just as with compounds the first component could theoretically be eliminated without altering the inflectional or categorial properties. This test is prohibited only by the trivial fact that suffixes by definition cannot occur without the first component; it is only for this reason that suffixal derivations cannot be endocentric.

These considerations are not applicable to prefixes since the first component of a derivation is irrelevant for the category of the whole, exactly as in compounds. For this reason their categorial status must remain undetermined or arbitrary where there is no relationship to a free form which could offer us a clue. Clear evidence for the category of a prefix could in principle be found when a prefix combines directly with a suffix and the suffix is in general bound to elements of certain categories only. Such cases are rare, but do exist; among them are *künstlich* 'artificial' and *mordsmäßig* 'terrific', mentioned in Section 4. Even if a suffix combines with different categories like our -*lich* – with nouns as in *ängstlich* 'fear-ly'/"fearsome", adjectives as in *ärmlich* 'poor-ly'/"rather poor" and verbs as in *begreiflich* 'comprehend-ly'/"comprehensible" – so that it cannot be directly inferred which category this *künst*- belongs to, such examples provide evidence at any rate for the assumption that affixes always belong to a certain category; for suffixes do not combine randomly with every possible category or with first components that have no category at all.16a

<sup>16</sup>aThe case of *mordsmäßig* is more transparent in this respect: -*mäßig* combines almost exclusively with a noun. The only exceptions are some instances of verbal stems as first components. Note that the type *mordsmäßig* (an evaluative first component plus a suffix) is by no means exotic in German. Bound first components similar to *mords*- are *knall*- in (i), *bomb*- in (ii), *ries*in (iii) and *pfund*- in (iv). An example of more recent coinage is *wahnsinn*- in (v):


While it seems reasonably plausible that, in some cases, bound first components are members of normal syntactic categories, this may be doubtful for certain others, e.g. for *un-* 'un-'. This need not be a formal problem, however. Let us say that formally a category is an *n*-tuple (*i, CF, IF, …*) with *n ≥* 2. The first member of the *n*-tuple is a natural number indicating the bar level of projection, 0 *≤ i ≤ m*, where *m* is the maximal level. (The value of *m* may vary with the type of category.) The second member *CF* is a set of specified categorial features. There may be a

### **9 Derivation with and without a suffix**

I have thus far given reasons for why it is sensible to assign compositions and derivations analogous constituent analyses. I have not yet explained why secondary words should have an internal constituent structure at all and not just certain boundary symbols or equivalents thereof that have to be assumed at any rate for the treatment of phonological phenomena. In addition to the question of whether (1) and (2) are to be given preference over (5) and (11), the related question arises with affixless derivations like *Tritt* 'kick, step' from *tret-* '(to) step' whether they are to be analyzed in a parallel fashion to [<sup>N</sup> [<sup>V</sup> *verfolg*] [<sup>N</sup> *ung*] ] as [<sup>N</sup> [<sup>V</sup> *tritt*] ] or indeed [<sup>N</sup> [<sup>V</sup> *tritt*] [<sup>N</sup> *∅* ] ].

The strictly lexicalist theory makes a prediction with respect to such affixless derivations. It is based on the regularity of composition.

The constituent structure types that we have seen up to this point are: the simple word without an added element (which naturally has exactly one category marking) and words with several components (whose category is determined by the final component). Since for simplex words the final immediate constituent of the word is identical to the word itself one can state the generalization that the category of a word is identical to the the category of its final immediate constituent. Since *Tritt* is a noun the final immediate constituent according to this theory – either *Tritt* itself or *∅* – must be a N; it would not be possible for *Tritt* to be a V as is asserted in the analysis [<sup>N</sup> [<sup>V</sup> *tritt*] ]. According to this theory only [<sup>N</sup> *tritt*] or [<sup>N</sup> [<sup>V</sup> *tritt*] [<sup>N</sup> *∅*] ] is to be expected. It is obvious that the assumption of a zero morpheme is problematic and is in need of careful justification at any rate; what we expect in view of the regularity of composition is therefore [<sup>N</sup> *tritt*]. We will examine this prediction with the help of certain stress phenomena.

Nouns and adjectives are in general stressed as far forward as possible (as long as no suffix that causes a deviant accentuation like -*eí*, -*ál* occurs). We find *Bevö́lkerung* '*be*-people-*er*-ing'/"population" but *Ǘberbevölkerung* 'over-population' just like *mä́ßig* 'measure-y'/"moderate(ly)" but *ǘbermäßig* 'over-measure-

universal set of features ([*±* N] and [*±* V] among them) which each category may draw upon. Categories capable of bearing inflection will have a third member, *IF*, a set of (specified) inflectional features; and there may exist more members. There is no reason to assume that every category is characterized by the same features differing only in their specifications (as + or -) or even by a constant number of specified features. Plausibly, a language learner will postulate a specified feature for a given linguistic element only if observable grammatical properties of the element lead him to do so. An element that does not display properties relevantly expressed by some specified feature will not be characterized by such a feature. Thus, the (uninflected) stems of adjectives, nouns and verbs that are relevant for word fomation may differ from the corresponding inflected words just by having an empty *IF*. Similarly, the *CF* of a prefix like *un*may be empty if *un*- never displays properties relevantly expressed by a (specified) categorial feature. This does not imply that such a prefix is a member of no category.

### 5 On composition and derivation

y'/"excessive". Verbs, on the other hand, are generally stressed on the stem, even if a stressable element appears before the stem. Thus we have *tréiben* 'drive' and also *untertréiben* 'under-drive'/"understate" and *übertréiben* 'over-drive'/"exaggerate". Similarly, the *miß*- in *Míßwirtschaft* 'mis-economy'/"mismanagement" and in *míßliebig* 'mis-love-y'/"unpopular" is stressed while *mißáchten* 'mis-regard'/"disregard" takes the primary stress on the verbal stem. How do adjectives and nouns that are formed on the basis of such verbs behave then? If the stress is determined by the category of the secondary word, which in a sense may be the simplest assumption, they would have to have initial stress; if it is determined by the category of the basis, they would have to be stressed on the stem. A contamination resulting from an interaction of both stress rules would also be conceivable.

There do not seem to be any examples of relevant compounds in common use. One can, however, use and understand ad hoc formations like *Durchsuchmethode* 'through-search-method'/"method of searching", *Unterführweise* 'underlead-manner'/"manner of channeling (under s. t.)", *Überstehversuch* 'over-standtrial'/"attempt to survive". Even if these formations are somewhat marginal, it is still clear how they are to be stressed. They have in any case verbal stress on the first component, so that *durch-, unter-, über-* are unstressed. From this we can conclude that the category of the compound is of no consequence and only the category of the respective component of the compound is relevant for the stress of the individual compound parts. With this conclusion we have found reason to assume structures like (1) for compounds.

According to the "compositional theory of affixation" we expect exactly the same result for suffixal derivations, and this expectation is fulfilled. Derivations ending in *-ung, -er, -bar, -sam, -lich* whose first component is identical to a verb or a regularly modified (by umlaut) form of a verb have the stress pattern of verbs, namely on the stem, cf. (79):


Nouns, on the contrary, which are formed from verbs without a clearly identifiable suffix have the stress pattern of nouns; the examples in (80) have stress on the initial component although the corresponding verbs are stressed on the stem:


Since in addition to this type derivations with *-ung* are often possible, we have doublets as in (81):


### 5 On composition and derivation

Interestingly, this rule holds also for derivations in -*t*: *Únterschrift* 'underwriting'/"signature" (cf. *unterschréib-* 'under-write'/"sign"), *Ǘbersicht* 'over-view'/ "survey" (cf. *überséh-* 'over-view'/ "survey"), *Míßgunst* 'mis-favor'/"envy" (cf. *mißgö́nn-* 'mis-grant'/"envy"). This is, upon first glance, surprising since this *-t* was at least at one time a productive suffix. Upon second glance it is a confirmation of the "compositional theory", for this *-t* is synchronically no longer productive in any sense of the word. Suffixes like *-nis*, for instance, are also no longer regularly used in spontaneous word formation (and are in this sense also not productive), ad hoc formations are however entirely possible and intelligible; thus, one could form from *erzwing-* '*er*-force'/get by force", *begreif-* 'comprehend', *hell* 'bright' the abstract nouns *Erzwängnis* 'enforcement', *Begreifnis* 'comprehension', *Hellnis* 'brightness', which means that the speaker can identify the suffix *-nis* and its function and can use it in applying rules (even if he does not usually do so). On the other hand it is entirely inconceivable that a speaker would construe a new abstract noun in *-t* spontaneously. This means that the speaker in fact not only does not use the suffix but that he is not able to use it, that he therefore does not identify it as such. In fact he cannot identify it, for in order to do so, he would have to be able at the same time to identify a rule which would derive the consonant before the *-t* from the consonant of the verb; cf. Wurzel (1970: 238ff.). It seems clear to me that this rule is not learnable synchronically.16b There is a relationship of mutual correspondence between *schreib*and *Schrift*; it is however completely lexicalized and could not be formulated in derivational rules. The *-t* will have to be analyzed as a component of a variant of the stem which itself is not decomposable (i.e., *schrift*, but not *schrif+t* derived from *schreib-*). Hence, the stress pattern of these words is entirely regular for they are not suffixal derivations synchronically but rather derivations without a suffix like *Míßbrauch* and *Ǘberfall*.

It can be observed from pairs like *Únterschied – Unterschéidung* that there are two different stress patterns typical of deverbative nouns. These stress patterns are not idiosyncratic, but rather each belongs to a well established paradigm: one holds generally for nouns, the other is the characteristic pattern for verbs in general.

The difference, since it is connected to the category distinction, is not statable in an obvious way if *Unterschied* and *Unterscheidung* have the same internal constituent structure. For that would mean that both derivations must either have the stress pattern typical of verbs, since they are formed from verbs, or the

<sup>16</sup>b*Fahrt* 'travel-*t*'/"journey" from *fahr*- 'travel' is about the only example that does not involve a mutation of the verbal stem which is unpredictable from the system of German phonology.

stress pattern typical of nouns, since both are nouns. The fact that *Unterschied* is stressed like a noun allows us to conclude that this morphological sequence has no other marking than that of a noun, which is necessary in any case. The fact that *unterscheid* in *Unterscheidung* does not display the stress typical of nouns allows us to conclude that this sequence is not marked as a noun (although *Unterscheidung* must be marked as a noun; we already know from our treatment of compounds that it is not necessarily the category of the secondary word but rather that of its immediate constituents that is relevant to stress). Since *unterscheid* has the stress of a verb, it is sensible to mark it as V. Thus we obtain the structures [<sup>N</sup> *unter* ͡*schied* ] and [<sup>N</sup> [<sup>V</sup> *unter* ͡*scheid*] [<sup>N</sup> *ung*] ]. With this the structures of (2), as distinct from those in (11), have found justification.

The difference between *Unterschied* and *Unterscheidung* that we have found is exactly what one would expect on the basis of the "compositional theory of affixation", and I know of no other theory that predicts such a distinction or could even characterize it naturally. In particular, the usual theory makes the distinction in the wrong place, in that the primary distinction is drawn between composition and derivation and only secondarily are subclasses of both types of word formation discerned. It separates suffixal derivations from compounds and places them together with suffixless derivations; the constituent structure of both derivational types is then looked upon as essentially the same but distinct from that of compounds.

### **10 Nominal infinitives**

The strictly lexicalist theory of word formation brings to attention several problems concerning the so-called nominal infinitive that are easily overlooked in other theories.

I have characterized infinitives that are dependent on verbs as verbal inflectional forms. Even if an infinitive is not dependent on a verb it can still have clear verbal characteristics, cf. (82a):

	- b. Karl 'Karl macht makes sich himself die the Freude joy [of] des the Kleine-Katzen-oft-Streichelns small cats often pet-*s*'

"Karl allows himself the joy of petting small cats often"

5 On composition and derivation

This apparent verbal construction can be combined however with an article and can take the genitive -*s*, as can be seen in (82b).

In contrast to these, there are formulations as in (83) which apparently have a purely nominal character:

(83) Sein 'his häufiges frequent Streicheln pet [of] kleiner small Katzen cats macht makes [to] Karl Karl Freude joy' "The frequent petting of small cats is a joy for Karl"

These are usually termed nominal infinitives. They have (as, of course, (82) also) the stress pattern typical of verbs: *Widersprechen* and *Hinterlegen* in (84) are stressed on the stem:

	- b. sein 'his häufiges frequent Hinterlégen behind-lay [of] großer large Geldsummen money-sums' "his frequent depositing of large sums of money"

According to the preceding discussion *Widersprechen* should then be analyzed as (85):

(85) [<sup>N</sup> [<sup>V</sup> wider ͡ sprech] [<sup>N</sup> en] ]

One may hesitate here, however. The form of this nominal infinitive is without exception identical to that of the verbal infinitive, especially with the irregular (in that the regular -*e*- is missing) infinitives *sein* 'be' and *tun* 'do'. This doubt is less than decisive, but I wish to take it seriously because it appears to be of heuristic interest.

We have already seen in (82b) that an infinitive can show simultaneously verbal and nominal features. The nominal features can be increased step by step along a certain hierarchy, cf. (86):

	- b. \* das 'the Oft-Streicheln often pet [of] kleiner small Katzen cats'
	- c. das 'the häufige frequent Streicheln pet [of] kleiner small Katzen cats' "the frequent petting of small cats"

The accusative object can only be replaced by a genitive when adverbial expressions are given adjectival form.16c The transition from (82a) via (86a) to (86c) suggests that in (84b) as well as in (86c) and (83) we have a verbal infinitive just as in (82a).

Several observations support this assumption. Verbs that obligatorily take a reflexive lose the reflexive when nominalized, cf. (87) vs. (88):

	- b. Karl 'Karl bewirbt applies sich himself um around den the Posten post' "Karl applies for the job"
	- c. Karl 'Karl strengt strains sich himself an, at das that zu to schaffen accomplish' "Karl makes every effort to accomplish that"
	- d. Karl 'Karl verabredet agrees sich himself mit with Heinz Heinz' "Karl makes an appointment with Heinz"

16cReplacement of the accusative by the (postnominal) genitive is also blocked by a dative:


Prepositional phrases expressing a goal, however, do not block such a replacement:


5 On composition and derivation

	- b. Karls 'Karl-*s* Bewerbung apply-ing (um (around den the Posten) post)' "Karl's application (for the job)"
	- c. Karls 'Karl-*s* Anstrengung at-strain-ing (das (that zu to schaffen) accomplish)' "Karl's efforts (to accomplish that)"
	- d. Karls 'Karl-*s* Verabredung agree-ing (mit (with Heinz) Heinz)' "Karl's appointment (with Heinz)"

With the nonlexicalized 'nominal infinitive' in (89), on the other hand, some element corresponding to the reflexive must appear, i.e., a reflexive accusative, not a genitive:

	- b. Karls 'Karl-*s* \*(Sich-)Bewerben (himself-)apply' "Karl's applying"
	- c. Karls 'Karl-*s* \*(Sich-)Anstrengen (himself-)at-strain' "Karl's making efforts"
	- d. Karls \*(Sich-)Verabreden
		- 'Karl-*s* (himself-)agree'

"Karl's making an appointment"

Furthermore, nonlexicalized 'nominal infinitives' appear in general to resist compounding. Hence we find the compounds in (90), but no analogous formations as in (91); those in (92) are to be understood as verbal constructions:16d

<sup>16</sup>dThis is to be expected since in general verbs that are not (part of) the determinans of a complex word do not serve as the determinatum of a compound; cf. note 15b.


While some speakers find the distinction between (91) and (92) somewhat subtle, the verbal character of (non-lexicalized) infinitives comes out very clearly when the first component of the secondary word cannot be interpreted as an object of the verb:


5 On composition and derivation

I suggest generating all nonlexicalized nominal infinitives by means of a rule like (93):

(93) N *<sup>k</sup> →* … V*<sup>n</sup>* …

It will have to be left to future studies to determine the value of *k* (possibly variable 0 *≤ k ≤ m*, where *m* is the maximal bar level of a projection) and whether *n* is constant. At any rate, *n* > 0 so that VK will be dominated by V*<sup>n</sup>* . Nominal infinitives like (94) which contain a dependent verb are a natural outcome of this rule:

	- b. das 'the bedauerliche regrettable Aufhörenmüssen on-hear-must' "the regrettable necessity to stop (here)"

### **References**


Chisholm, David. 1977. Generative prosody and English verse. *Poetics* 6. 111–153.


### **Chapter 6**

## **Der Begriff 'Mittelfeld'. Anmerkungen über die Theorie der topologischen Felder**

Tilman N. Höhle

Über den Begriff 'Mittelfeld' kann man vernünftig reden nur dann, wenn seine systematische Stellung innerhalb der Lehre von den topologischen Feldern klar ist. Nur dann ist klar, welche theoretischen und empirischen Ansprüche sich mit diesem Begriff verbinden und welche sich mit ihm nicht verbinden.

### **1 Topologische Satztypen**

In der Theorie vom Aufbau des deutschen Satzes sind drei topologische Satztypen zu unterscheiden. Ich bezeichne sie als E-Sätze, F1-Sätze und F2-Sätze; F1- und F2- Sätze fasse ich als F-Sätze zusammen.<sup>1</sup> In (1) sind die topologischen Schemata für diese Satztypen angegeben [vgl. auch Fn. 5], in (2) sind die Siglen erklärt, und in (3) bis (5) sind einige Beispiele nach den Schemata analysiert.

<sup>1</sup>Das 'F' soll an '*FINIT*' und 'frontal' erinnern. E-Sätze sind in bestimmter Weise elementar, daran kann man bei dem 'E' denken.

Tilman N. Höhle. 2019. Der Begriff 'Mittelfeld'. Anmerkungen über die Theorie der topologischen Felder. In Stefan Müller, Marga Reis & Frank Richter (Hrsg.), *Beiträge zur deutschen Grammatik. Gesammelte Schriften von Tilman N. Höhle. Zweite durchgesehene Auflage*, 279–294. Berlin: Language Science Press. DOI:10.5281/zenodo.2588357

<sup>§</sup>*Anmerkung der Herausgeber:* Diese Arbeit wurde erstmals veröffentlicht in Schöne, Albrecht (Hrsg.). 1986. *Kontroversen, alte und neue. Akten des VII. Internationalen Germanisten-Kongresses Göttingen 1985.* Bd. 3: Weiss, Walter E., Wiegand, Herbert E. & Reis, Marga (Hrsg.). *Textlinguistik contra Stilistik? – Wortschatz und Wörterbuch – Grammatische oder pragmatische Organisation von Rede?*, 329–340. Tübingen: Niemeyer. Editorische Eingriffe in den Wiederabdruck beschränken sich im Wesentlichen auf Anpassungen an das einheitliche Bandformat (zwei kleine Textergänzungen finden sich, in eckigen Klammern, S. 279 und S. 289, Fn.13). – Zum besseren Verständnis der in der vorliegenden Arbeit teilweise sehr knapp gehaltenen Ausführungen vergleiche man die ausführliche Darstellung in *Topologische Felder* (Kapitel 1 in diesem Band, S. 7–89).

	- b. *FINIT*: Träger von Finitheitskategorien
	- c. *KOORD* (koordinierende Partikeln): *und*, *oder*, *aber*, *sondern*, *(weder-) noch*, …
	- d. *PARORD* (nicht-koordinierende beiordnende Partikeln): *denn*, *weil2*, …
	- e. *X*, *Y*: Folge von beliebig vielen (auch: null) Konstituenten
	- f. *C* ('complementizer'):
		- i. *ob*, *daß*, …
		- ii. *um*, *weil<sup>1</sup>* , *obwohl*, *nachdem*, *wenn*, *zumal*, *ehe*, …
		- iii. *je*+Komparativ-Phrase; *so*+Positiv-Phrase; Relativ-Phrase; Interrogativ-Phrase
	- g. *K*: 1 Konstituente
	- h. *KL*: proleptisch oder pendent gebrauchte Konstituente ('Linksversetzung', 'Nominativus pendens')

Die in (3) bis (5) niedergelegten Analysen sind weitgehend üblich, deshalb kann ich mich auf wenige Kommentare beschränken.<sup>2</sup>

Der Verbkomplex *VK* besteht nach (2a) aus beliebig vielen Verbformen V, zu denen jeweils ein Verbzusatz (ein " trennbares Präfix") VZ gehören kann. Jedes V ist finit, ein 'einfacher' Infinitiv, ein 'Infinitiv mit *zu*' oder ein Partizip 2. *VK* ist immer echter oder unechter Teil des Unterfelds des Schlußfelds eines Kohärenzfelds im Sinne von Bech (1955: 62ff.); zu diesem Kohärenzfeld gehören neben

<sup>2</sup>Man beachte, daß die Kette *wer kommt* in (3j) topologisch völlig anders analysiert ist als in (5d). Diese Verschiedenheit ist durch die je spezifischen Baugesetze von E-Sätzen und F2-Sätzen begründet. Daß in (3j) ein E-Satz und in (5d) ein F2-Satz vorliegt, ergibt sich aus der je spezifischen Distribution der verschiedenen topologischen Satztypen; ein wichtiges und komplexes Thema, auf das ich nicht eingehe (zur Orientierung vgl. Reis 1985).


(3)

6 Der Begriff ,Mittelfeld'


*KOORD* *PARORD*

*KL*

*K*

*FINIT*

*X*

*VK*

*Y*

### 6 Der Begriff ,Mittelfeld'

*VK* immer auch *X* und *FINIT* (und eventuell andere Abschnitte der Schemata).<sup>3</sup> Um einen Satz gemäß (1) analysieren zu können, muß man also seine Gliederung in Kohärenzfelder kennen.<sup>4</sup> Wenn ein Kohärenzfeld ein finites Verb Vfin enthält, steht Vfin bei F-Sätzen in der *FINIT*-Position; dann kann *VK* leer sein, wie bei


In diesem Fall ist *VK* (*füttern wollen*) also echter Teil des Unterfelds, und das finite Verb *hätte* steht in *X*. In (iii) dagegen ist das Schlußfeld nach Bech identisch mit seinem Unterfeld (iv); *VK* ist hier also unechter Teil des Unterfelds (und *habe* steht in *FINIT*):


<sup>4</sup>Dabei kann man Bechs Theorie von den Kohärenzfeldern nicht ohne Ergänzungen und Modifikationen übernehmen. So ist es sinnvoll, in Beispielen wie (i) die Infinitivkonstruktion (ii) genauso wie in (iii) und (iv) als (satzwertiges) eigenes Kohärenzfeld zu analysieren; das ist mit Bechs Definitionen und Annahmen – die im Allgemeinen empirisch wohlbegründet sind – jedoch nicht vereinbar:


Hier könnte eine einfache Modifikation das wünschenswerte Resultat erzielen. Schwieriger sind Fälle wie (v):

	- b. obwohl er mir das Auto versucht hat wegzunehmen
	- c. wenn dir anfängt schlecht zu werden

Bei dem gleichartigen Beispiel (vi) schlägt Bech (1955: 66) vor, *glaubten* als Oberfeld des Schlußfelds aufzufassen:

(vi) … daß sie eine Absicht glaubten verbergen zu können, die so zutage lag

Ebenso könnte man bei (v) verfahren; in beiden Fällen setzt das jedoch eine erhebliche Weiterentwicklung und Modifikation der Lehre vom Oberfeld voraus. Mit Beispielen wie (v) und (vi) hat die Theorie (1) natürlich dieselben Schwierigkeiten wie Bechs Theorie: Es ist nicht ohne weiteres klar, ob in (v.a) *versucht* oder *zu verkaufen* (in (v.b): *versucht hat* oder *wegzunehmen*; in (v.c): *anfängt* oder *zu werden*) der relevante *VK* ist. Nimmt man statt dessen an, daß *ein Auto zu verkaufen* (v.a), *wegzunehmen* (v.b) und *schlecht zu werden* (v.c) in *Y* stehen, muß die Theorie über den Aufbau von *X* und *Y* verändert werden.

<sup>3</sup> In Beispielen wie (i) ist nach Bech die Kette (ii) als Schlußfeld zu interpretieren; dabei ist *hätte* das Oberfeld und *den Hund füttern wollen* das Unterfeld:

(4b), (4d), (5b) und (5d), oder lediglich einen VZ enthalten, wie bei (5c) und (5e). Bei E-Sätzen steht Vfin in *VK*, z. B. bei (3f) bis (3j), oder in *X*, wie bei Beispiel (i) von Fn. 3.

Die Position *C* ist in finiten E-Sätzen des Deutschen obligatorisch gefüllt. E-Sätze ohne *C* sind infinit, wie (3c), oder enthalten wie (3e) eine Aufforderungsform, die mit dem einfachen Infinitiv gleichlautet, bei der jedoch ein sonst unentbehrliches Reflexivpronomen ausfällt.<sup>5</sup>

Beiordnende (koordinierende und nicht-koordinierende) Partikeln gehören nach (1) zu dem Satz, den sie einleiten. Für diese Auffassung sprechen Fälle wie (3a), (3b), (4a), (5c), (5d). Solche Sätze kann man äußern, ohne zuvor einen Satz geäußert zu haben, der als ein erstes Konjunkt interpretiert werden könnte. Weitere Fakten führen zu demselben Schluß: *KOORD* und *PARORD* stehen nicht irgendwo 'zwischen' Sätzen, die sie verknüpfen, sondern leiten einen angeknüpften Satz gemäß (1) ein.

Das Auftreten der Position *K<sup>L</sup>* ist an strenge Restriktionen gebunden, auf die ich hier nicht eingehe.

### **2 Wesentliche Bestandteile der Theorie der topologischen Felder**

Die einzelnen Abschnitte der Schemata von (1) will ich als (topologische) Felder bezeichnen. In F2-Sätzen existiert ein *K*-Feld; in allen drei Satztypen existiert ein *X*-Feld, ein *VK*-Feld und ein *Y*-Feld. Bevor ich darauf weiter eingehe, ist eine Bemerkung über komplexe Sätze zu machen.

	- b. (er benimmt sich) als ob er ein Genie wäre

Ähnlich muß man für (iii) annehmen, daß es zu (1b) eine Variante (iv) gibt:


Beispiele wie (v) zeigen, daß auch bei (uneingebetteten) E-Sätzen Prolepse möglich ist:


<sup>5</sup> Für Beispiele wie in (i) muß man annehmen, daß es zu (1a) eine Variante (ii) gibt, wobei *ehe* und *als* in *C1* und *daß* und *ob* in *C2* sind:

### 6 Der Begriff ,Mittelfeld'

Die Schemata von (1) können den Eindruck erwecken, nur für atomare Sätze geeignet zu sein, also für Sätze, die nicht ihrerseits einen Satz echt enthalten. Tatsächlich reichen die Schemata aus, um beliebig komplexe Satzgebilde vollständig und befriedigend topologisch zu analysieren; dazu bedarf es allerdings einer adäquaten Theorie der Beiordnung und der Einbettung von Sätzen. Eine solche Theorie existiert seit Herling (1821); 6 seine Darlegungen umschreibe ich in (6):

	- b. So, wie z. B. eine Nominalphrase Teil eines Trägersatzes (oder einer anderen Wortgruppe) sein und dann in ihm eine syntaktische Funktion haben kann, so kann auch ein Satz Teil eines Trägersatzes (oder einer anderen Wortgruppe) sein und dann in ihm eine syntaktische Funktion haben.
	- c. Nach (a) und (b) ist zu erwarten: So, wie z. B. Nominalphrasen, die innerhalb eines Satzes (oder einer anderen Wortgruppe) eine syntaktische Funktion haben, in einem topologischen Abschnitt dieses Satzes (dieser Wortgruppe) stehen, so stehen auch Sätze, die innerhalb eines Trägersatzes (oder einer anderen Wortgruppe) eine syntaktische Funktion haben, in einem topologischen Abschnitt dieses Trägersatzes (dieser Wortgruppe).

Eingebettete Sätze stehen also genauso wie andere Konstituenten im Abschnitt *X*, *Y*, *K* oder *K<sup>L</sup>* ihres Trägersatzes (wenn sie nicht Teil einer Nominalphrase o. ä. sind); vgl. etwa die Beispiele (3d), (4b), (5b). Jeder topologische Satztyp kann eingebettet und uneingebettet auftreten.

Die durch (1) gegebene Theorie der topologischen Felder ist mit wichtigen empirischen Erkenntnissen verknüpft, die in (7) genannt und im folgenden kurz diskutiert sind:

	- b. Für die Besetzung von *VK* gelten bestimmte Gesetzmäßigkeiten G*VK*; diese sind in allen Satztypen gleich.

<sup>6</sup> Sowohl die Theorie der Beiordnung (6a) als auch die Theorie der Einbettung (6b) hat Vorgänger, aber Herling hat sie offenbar als erster präzise zusammengefaßt und vor allem als erster Konsequenzen für die Topologie gezogen (6c). Erst mit Herlings Arbeiten ist eine deutsche Syntax im prägnanten Sinn entstanden: eine umfassende Theorie über den topologischen und den hierarchischen Aufbau komplexer Sätze.


Zu (7a): Die Gesetzmäßigkeit G*<sup>F</sup>* ist bereits in den Erläuterungen zu (2) genannt worden: Wenn das unabhängige Verb eines Satzes finit und der Satz ein F-Satz ist, steht Vfin in der *FINIT*-Position. Infinite Verben stehen – so wie auch finite Verben in E-Sätzen – in *VK*. Offensichtlich ist *VK* der systematisch für Verben vorgesehene topologische Bereich. (Von den in den Fn. 3 und 4 erwähnten Fällen sehe ich hier ab.) Man muß fragen: Warum stehen finite Verben in F-Sätzen nicht in *VK*, sondern in *FINIT*? Die korrekte Antwort hat Herling (1821) gegeben: F-Sätze haben eine spezielle Position für Ausdrücke, in denen sich die Finitheitskategorien manifestieren.<sup>7</sup> Ein finites Verb steht in *FINIT* also nicht deshalb, weil es ein Verb ist, sondern deshalb, weil es Träger von Finitheitskategorien ist.

Becker (1829) hat diese Theorie von Herling übernommen (so, wie er auch in den Annahmen (6) mit Herling übereinstimmt) und in interessanter Weise verschärft, indem er schreibt (1829: 378f.):<sup>8</sup>

(8) [W]ir unterscheiden demnach in der Topik des prädikativen Satzverhältnisses *drei Stellen*, nämlich die des *Subjektes*, der *Kopula* [ = Finitheitskategorien, TNH] und des *Prädikativs* z. B.


Wenn das Prädikat durch ein einfaches Verb in einer einfachen Flexionsform ausgedrückt ist; so nimmt das Verb, welches den Begriff und durch die Flexion zugleich die Beziehungen ausdrückt, immer die Stelle der Kopula ein. Wir lassen jedoch, um alle Verschiedenheit der deutschen Topik unter wenigen Gesetzen zusammenfassen zu können, auch für diesen Fall *drei Stellen* gelten, indem wir annehmen, daß das Verb alsdann die Stelle

<sup>7</sup>Die Finitheitskategorien sind: Person, Numerus, morphologisches Tempus (Präsens, Präteritum), morphologischer Modus (Indikativ, Konjunktiv, Imperativ). Möglicherweise sind nicht alle diese Kategorien für die Charakterisierung von *FINIT* relevant.

<sup>8</sup>Beckers Prädikativ ist nicht ganz identisch mit *VK*: *geblühet*, *sprechen*, *auf* stehen in *VK*; *schön* dagegen steht in *X*.

6 Der Begriff ,Mittelfeld'

der Kopula einnehme, und daß auf die *nicht ausgefüllte* Stelle des Prädikativs andere topische Verhältnisse, wie die des objektiven Faktors, bezogen werden z. B.

*Subjekt Kopula Prädikativ* Der Baum blühet – Das Kind spricht –

Auf gewisse Gesetze, die " auf die *nicht ausgefüllte* Stelle" Bezug nehmen, kommen wir in Abschnitt 4 zurück.

Zu (7b): Die im Standarddeutschen geltenden Gesetzmäßigkeiten G*VK* hat Erdmann (1886: 191ff.) dargelegt; etwas konziser formuliert Blümel (1909: 528f.):

(9) Auf alle anderen nichtverbalen satzteile folgen ständig infinitiv oder particip perfect, diesen der infinitiv oder das particip perfect, von dem sie abhängen (das gilt auch, wenn sich das abhängigkeitsverhältnis widerholt). In entsprechender weise steht nach den nominalformen des verbs im N [= nebensatz, TNH] das verbum finitum, von dem sie abhängen. Vor dem infinitiv steht, wenn nötig, *zu*. Vor dieser masse stehen die bestimmungen, welche mit dem verbum finitum unfeste Zusammensetzungen eingehen, also die präpositionaladverbien wie *ab*, *auf*, bestimmungen wie *zu grunde* (*richten*), *schlittschuh* (*laufen*); *in anwendung* (*bringen*) […].

Bechs Regeln für den Aufbau des Unterfelds eines Schlußfelds (1955: 63, 67f.) sind praktisch identisch mit (9).

Zu (7c): Auf die Gesetzmäßigkeiten G*<sup>Y</sup>* gehe ich nicht ein (vgl. etwa Erdmann 1886: 192, 197). Es sei nur erwähnt, daß – entgegen einer Behauptung von Griesbach (1960: 109) – mehr als 1 Konstituente in *Y* stehen kann.

Zu (7d): Die Gesetzmäßigkeiten G*<sup>X</sup>* sind höchst kompliziert. Blümel deutet das plastisch an, indem er das *<sup>X</sup>*-Feld als ein " kampfgebiet" bezeichnet, " in dem sich die gesetze der *gliederung*, des *rhythmus* und der *function* z. t. durchkreuzen" (1909: 530). Verschiedene Versuche, hier mit sehr wenigen sehr allgemeinen Regeln auszukommen (wie Erdmann 1886: 189ff.), haben sich als unzureichend erwiesen. (Zur neueren Forschung kann man etwa Hoberg (1981), Jacobs (1983), Abraham (1985) und dort genannte Literatur vergleichen.)<sup>9</sup>

Diese Kompliziertheit der Stellungsregularitäten gilt auch für ein Subjekt, das sich im *X*-Feld befindet. Dieser Umstand falsifiziert alle traditionellen Varianten einer Subjektinversionstheorie. Diese Theorien nehmen an, daß der natürliche

<sup>9</sup>Da die G*<sup>X</sup>* und G*<sup>Y</sup>* verschieden sind, kann man die Grenze zwischen *X* und *Y* häufig auch dann bestimmen, wenn *VK* leer ist. In (4b) z. B. befindet sich der ('extraponierte') Relativsatz eindeutig im *Y*-Feld, während *auch* sich im *X*-Feld befindet.

Ort des Subjekts am Satzanfang liegt, daß es also in F2-Sätzen das *K*-Feld einnimmt (und in E- und F1-Sätzen den Beginn des *X*-Felds bildet). Ein Nicht-Subjekt soll dadurch in *K* gelangen, daß es (i) gemeinsam mit dem finiten Verb vor das Subjekt tritt (so z. B. Bierwisch 1963) oder (ii) an die ursprüngliche Stelle des Subjekts tritt, wobei das Subjekt hinter das finite Verb gestellt wird (so z. B. Herling 1821). In beiden Fällen können die Positionsmöglichkeiten für das nunmehr nachstehende Subjekt nicht korrekt formuliert werden, da das Subjekt im *X*-Feld (ebenso wie alle anderen Elemente in *X*) komplexen eigenen Stellungsregularitäten unterliegt, die in allen topologischen Satztypen gleich sind.

Zu (7e): Die Gesetzmäßigkeiten G*<sup>K</sup>* sind wiederum zu komplex, um hier näher darauf einzugehen. Wichtig ist: Sie sind nicht eine Untermenge der Gesetzmäßigkeiten G*<sup>X</sup>* oder G*<sup>Y</sup>* . Gegen die traditionelle Annahme, daß ein Subjekt seinen natürlichen Ort in *K* hat, spricht nicht nur die schon erwähnte Unmöglichkeit, die Position eines 'invertierten' Subjekts dann korrekt und allgemein zu spezifizieren. Vielmehr fehlt dieser Annahme bereits ihre intuitive Grundlage. Die Beispiele in (10) haben Nicht-Subjekte in K, ohne daß diese Wortstellung in irgendeiner Weise als 'markiert', 'nicht-normal'<sup>10</sup> empfunden würde:

	- b. gestern ist mein Vater nach Berlin gefahren
	- c. neulich hat jemand nach dir gefragt
	- d. wenn es regnet, wird die Straße naß

Daß das *K*-Feld systematisch keine Subjektposition ist, hat besonders Erdmann (1886: 182f.) nachdrücklich betont; dieselbe Erkenntnis findet sich bereits bei Götzinger (1827: 232f.), Koch (1854: 187) und Gabelentz (1875: 144f.).<sup>11</sup>

Die durch (1) und (7) bestimmten Grundzüge der Theorie der topologischen Felder sind in allen wesentlichen Teilen bei Erdmann (1886) zusammengefaßt, und was bei Erdmann implizit bleibt (vor allem (7a) und (6)), steht explizit bei Herling (1821). Man kann diese Theorie deshalb als das Herling/Erdmann-System bezeichnen. Seit 1886 sind die Gesetzmäßigkeiten G*<sup>X</sup>* , G*<sup>Y</sup>* und G*<sup>K</sup>* zum Teil genauer untersucht und präziser formuliert worden; das System hat sich dabei so bewährt, daß keine wesentlichen Korrekturen nötig geworden sind.

<sup>10</sup>Zur Klärung des Konzepts der '(nicht-)normalen' Wortstellung vgl. Höhle (1982).

<sup>11</sup>Aus (7e) und – unabhängig davon – aus (7a) ergibt sich, daß Beispiele wie *der Kater verfolgte einen Schmetterling* nicht als Indiz dafür zu werten sind, daß das Deutsche eine SVO-Sprache im Sinne vonGreenberg (1966) ist. Da die systematische Verbposition in *VK* – also nach Subjekt und Objekt – ist, muß das Deutsche als SOV-Sprache betrachtet werden (falls es hinsichtlich des S/V/O-Parameters überhaupt zu klassifizieren ist). Greenberg selbst rechnet das Deutsche seltsamerweise unter die SVO-Sprachen; dazu paßt, daß er das Beispiel (10b) selbst zitiert, aber mit einem empirisch radikal falschen Kommentar versieht (1966: 104).

### 6 Der Begriff ,Mittelfeld'

Das Herling/Erdmann-System ist eine sehr untriviale und dabei äußerst erfolgreiche Theorie, die viele tiefe Erkenntnisse über den Aufbau deutscher Sätze beinhaltet. Man muß sich aber über ihre Grenzen im klaren sein. Sie macht z. B. so, wie sie ist, keine Aussage über die Gliederung des Satzes in Wortgruppen (Konstituenten), außer bei *K*. Insbesondere impliziert sie z. B. nicht, daß die Elemente im *X*-Feld eine Konstituente bilden, daß sie sämtlich Schwesterkonstituenten voneinander sind oder daß sie sonstwie alle gleichartig oder gleichwertig sind; sie impliziert auch nicht, daß die Elemente im *Y*-Feld oder die Elemente im *VK*-Feld eine Konstituente bilden. Sie setzt zwar gewisse, mindestens rudimentäre Kenntnisse von den Gesetzmäßigkeiten G*K*, G*<sup>X</sup>* und G*<sup>Y</sup>* und ihrer Verschiedenartigkeit voraus, macht aber keine detaillierten oder gar vollständigen Angaben darüber. Die Aufdeckung der Konstituentenstruktur und der genauen Gesetzmäßigkeiten ist vielmehr Gegenstand weiterer Forschung, in der (1) und (7) vorauszusetzen sind.<sup>12</sup>

### **3 Zur Felder-Terminologie**

Erdmann hat den Abschnitten, die ich durch Siglen wie " *K*, *X*, *VK*, *Y*" bezeichnet habe, keine Namen gegeben, sondern sie durch Aufzählung ihrer Elemente und relative Positionsangaben charakterisiert. Die Tradition, topologische Satzabschnitte als 'Felder' zu bezeichnen, ist von Drach (1937) begründet worden. Mit dem Herling/Erdmann-System hat Drachs Feldereinteilung allerdings so gut wie nichts zu tun. Er spricht von Feldern ausschließlich bei F2-Sätzen, in denen *X*, *VK* oder *Y* nicht leer ist. In diesen Fällen bezeichnet er *K* als 'Vorfeld' und alles nach *FINIT* als 'Nachfeld'; das finite Verb in *FINIT* ist dann die 'Mitte'. Einen Begriff 'Mittelfeld' gibt es bei Drach nicht.<sup>13</sup>

<sup>12</sup>Auf der Grundlage von (1) kann man, wenn man will, einen 'Satzrahmen' oder eine 'Satzklammer' definieren: Ein 1. Rahmen-/Klammerteil wird durch *FINIT* oder *C* gebildet, ein 2. Rahmen- /Klammerteil durch *VK*. Die beiden Rahmen-/Klammerteile bilden zusammen dann den Rahmen/die Klammer. Das ist zwar überflüssig, aber soweit nicht schädlich. Höchst bedenklich ist jedoch die Vorstellung mancher Autoren, das Deutsche sei (im Unterschied zu anderen Sprachen) von einem Bedürfnis zur Rahmen-/Klammerbildung durchwaltet, und diese oder jene syntaktische Erscheinung sei als Ausfluß dieses Bedürfnisses zu verstehen. Wo es möglich scheint, aus dieser Idee konkrete empirische Prädiktionen zu deduzieren, erweist sie sich als falsch; ansonsten ist das purer Mystizismus. Das Herling/Erdmann-System ist dieser Ideologie in keiner Weise verpflichtet.

<sup>13</sup>Der *Ausdruck* 'Mittelfeld' kommt allerdings einmal in verhüllter Form vor: " das denkwichtigste Satzglied […] kann im Vor-, Mittel- oder Nachfeld erscheinen" (1937: 27). Das ist offensichtlich ein sprachliches Versehen. [Wie von TNH korrigierend angemerkt (p. M. 04/2016), benutzt Drach den Ausdruck auch unverhüllt: " die syntaktische Klammer nimmt im Hauptsatz vom Verb – also im Mittelfeld – ihren Ausgang" (1937: 52). Begrifflich entspricht 'Mittelfeld' aber auch hier nicht dem heutigen Gebrauch.]

Erben (1954) hat Drachs Terminologie stark modifiziert. Er bezeichnet in allen Satztypen alles (außer Konjunktionen und *VK*), was sich vor dem finiten Verb befindet, als 'Vorfeld', neben *K* also z. B. auch *X* in E-Sätzen (z. B. 1954: 24). Wenn zwischen finitem Verb und einem realisierten *VK* etwas steht – besonders also *X* in F-Sätzen –, bezeichnet er dies als 'Mittelfeld' (vgl. z. B. 1954: 19f., aber auch 1954: 23f.). In allen Satztypen bezeichnet er das, was auf die letzte (finite oder infinite) Verbform folgt, als 'Nachfeld'. In einem F-Satz mit gefülltem *VK* ist also nur *Y* ein Nachfeld; wenn *VK* leer ist, gehört auch *X* zum Nachfeld. Man sieht, daß auch diese Felder-Terminologie wenig mit dem Herling/Erdmann-System zu tun hat.

Erst Griesbach (1960) hat das Herling/Erdmann-System mit einer Felderterminologie versehen. Er bezeichnet *K* als 'Vorfeld', *X* als 'Satzfeld' und *Y* als 'Nachfeld'.

Engel hat Griesbachs Einteilung (also das Herling/Erdmann-System mit Griesbachs Felder-Terminologie) 1970 übernommen, fand es aber passend, den Ausdruck 'Satzfeld' durch Erbens Ausdruck 'Mittelfeld' zu ersetzen (Engel 1970a: 39; Engel 1970b: 50).<sup>14</sup> Von hier aus hat sich die Bezeichnung 'Mittelfeld' für den Abschnitt *X* in die zeitgenössische Literatur verbreitet.

### **4 Deskription und Explanation**

Es liegt auf der Hand, daß der Begriff 'Mittelfeld' (= 'Satzfeld', *X*-Feld) ein eminent nützlicher deskriptiver Hilfsbegriff ist, wenn man sich mit den komplexen Stellungsmöglichkeiten zwischen *VK* und *FINIT* bzw. *C* beschäftigt, und es war ein langer Weg bis zu der folgenreichen Beobachtung, daß die G*<sup>X</sup>* für alle topologischen Satztypen identisch sind.

Wenn man jedoch darangeht, die G*<sup>K</sup>* und die G*<sup>X</sup>* exakt zu formulieren, benötigt man (mindestens) einen weiteren deskriptiven Begriff, nämlich die Zusammenfassung von *X* und *VK*. Ich will den aus *X* und *VK* bestehenden topologischen Abschnitt als S-Feld bezeichnen.

Das *K*-Feld (= 'Vorfeld') kann erstens durch gewisse besondere Elemente besetzt werden; darauf gehe ich hier nicht ein. Zweitens kann ein Element " aus dem Satzfeld herausgehoben und vor den ersten Prädikatsteil, die vordere Satzfeldbegrenzung gestellt" werden (Griesbach 1960: 105). Tatsächlich kann nicht

<sup>14</sup>Dazu könnte Engel von einer Äquivokation bei Stolt ([1966]: 2) angeregt worden sein: " Der von den Prädikatsteilen begrenzte Teil wird das 'Satzfeld' (auch 'Mittelfeld') genannt." Definitorisch von den 'Prädikatsteilen' begrenzt ist Erbens 'Mittelfeld'; Griesbachs 'Satzfeld' ist ganz anders definiert.

6 Der Begriff ,Mittelfeld'

nur ein Element aus *X* 'herausgehoben' werden; auch ein Element aus *VK* kann ins *K*-Feld treten:

	- b. füttern möchte sie den Hund dürfen

Eine Konstituente, die im *Y*-Feld ('Nachfeld'), aber nicht im *X*-Feld stehen kann, kann nicht im *K*-Feld stehen:

	- b. \* Karl ist, daß er so viel getrunken hatte, wahrscheinlich stolz gewesen
	- c. \* daß er so viel getrunken hatte, ist Karl wahrscheinlich stolz gewesen

Eine Konstituente, die im *K*-Feld und im *Y*-Feld stehen kann, kann – mehr oder weniger gut – auch im *X*-Feld stehen:

	- b. sie hat ihm nur ungern zugesagt, daß sie ihm helfen würde
	- c. sie hat ihm, daß sie ihm helfen würde, nur ungern zugesagt

Die zweite Besetzungsmöglichkeit für das *K*-Feld lautet also verallgemeinert: Ein Element eines S-Felds kann ins *K*-Feld treten.

Skopusbildende Elemente können je nach Stellung innerhalb des *X*-Felds anderen semantischen Skopus haben; im typischen Fall liegen jedoch stets die Elemente von *VK* in ihrem Skopus. Hier ist außerdem Beckers Idee relevant, daß dem in *FINIT* stehenden Verb eine " nicht ausgefüllte Stelle" in *VK* entspricht, auf die die topologischen Regeln bezogen werden (vgl. (8)): Auch das finite Verb in F-Sätzen liegt gewöhnlich im Skopus von Elementen des *X*-Felds. Vgl. Jacobs (1982; 1983). Ähnliches gilt für das Phänomen der Fokusprojektion: Wenn gewisse Elemente in *X* betont sind, kann der Fokus außer dem betonten Element auch die Elemente von *VK* und das finite Verb in F-Sätzen umfassen (vgl. Höhle 1982). Diese und andere Fakten machen deutlich, daß es bei den Stellungsregularitäten von Elementen in *X* häufig nicht allein oder primär um deren lineare Anordnung innerhalb des *X*-Felds geht; es geht vielmehr um die Effekte, die die Stellung eines Elements von *X* in Hinsicht auf andere Elemente von *X* und auf Elemente von *VK* (und, teilweise, auf Elemente von *Y*) hat. Damit erweist sich der *X*-Feld-Begriff als theoretisch sekundär; das *X*-Feld ist also (wenn man diesen Begriff weiter benutzen will) korrekter als der vor *VK* stehende Abschnitt des S-Felds zu definieren.

Darauf, daß der S-Feld-Begriff notwendig und gegenüber dem *X*-Feld-Begriff primär ist, weist auch der Sprachvergleich hin. Das Herling/Erdmann-System hat Gültigkeit für das Deutsche und das Niederländische, mit kleinen Ergänzungen auch für das (West-)Friesische (vgl. Haan 1983). Mit ähnlichen Ergänzungen hat es auch für die skandinavischen Sprachen (Dänisch, Schwedisch, Norwegisch; mit zusätzlicher Ergänzung (vgl. Platzack 1984) auch Isländisch und Färöisch) Geltung, mit einem wesentlichen Unterschied: *VK* folgt nicht auf *X*, sondern steht zwischen (gewissen) Elementen von *X*. <sup>15</sup> Für sie gelten (stark vereinfacht) die Schemata (14):


Hier ist es nicht möglich, einen sinnvollen *X*-Feld-Begriff zu definieren, wie man es im Deutschen, Niederländischen und Friesischen tun kann. Die wesentliche Gemeinsamkeit von (14) und (1) findet ihren Ausdruck, indem man auf den S-Feld-Begriff rekurriert.

Mit der Einführung des S-Felds wächst die deskriptive Potenz der Theorie der topologischen Felder; eine explanative Theorie ist sie damit noch nicht. Explanativ kann eine Theorie nur sein, wenn sie (a) universal und (b) restriktiv ist; an beidem mangelt es der topologischen Theorie. Eine nach Erklärung strebende Theorie muß den empirischen Gehalt der topologischen Theorie im Rahmen einer restriktiven universalen Syntaxtheorie rekonstruieren. Mit dieser Aufgabe wird die Forschung noch eine Weile beschäftigt sein. Die jüngere Literatur, auf die ich verwiesen habe, enthält einige Ansätze dazu.

### **Literatur**


<sup>15</sup>Alle skandinavischen Sprachen sind SVO-Sprachen. Für das Jiddische gilt eine Variante von (1) oder von (14); mir ist nicht klar, ob es zu den SOV- oder zu den SVO-Sprachen gehört.



### **Chapter 7**

## **Assumptions about asymmetric coordination in German**

Tilman N. Höhle

### **1 Symmetric and asymmetric coordination**

Consider an S-structure configuration containing a coordinate structure such as (1):

(1) <sup>1</sup>A … *<sup>k</sup>*A [(& ) <sup>1</sup>B … & *<sup>n</sup>*B] *<sup>k</sup>*+1A … *<sup>m</sup>*A

where each *<sup>i</sup>*B is a conjunct, each & is a coordinating particle such as *und* 'and', and each *<sup>i</sup>*A is an element external to the conjuncts (*m ≥* 0; *n ≥* 2). The fundamental principle of coordination that I will assume is (2):

	- a. whose structure and whose combinatorial properties follow from general rules that are independent of coordination, or
	- b. which conforms to the coordination scheme (1).

Prototypical coordinate structures are symmetric in the sense that they comply with some principle like (3):

<sup>§</sup> *Editors' note:* This paper was originally published in Joan Mascaró & Marina Nespor (eds.). 1990. *Grammar in progress. Glow essays for Henk van Riemsdijk* (Studies in Generative Grammar 36), 221–235. Dordrecht: Foris. The layout and citation style have been adapted to the format chosen for the present volume.

Tilman N. Höhle. 2019. Assumptions about asymmetric coordination in German. In Stefan Müller, Marga Reis & Frank Richter (eds.), *Beiträge zur deutschen Grammatik. Gesammelte Schriften von Tilman N. Höhle. Second revised edition*, 295–310. Berlin: Language Science Press. DOI:10.5281/zenodo.2588359

(3) *External Homogeneity Condition*:

The combinatorial properties of each *<sup>i</sup>*B are satisfied by <sup>1</sup>A, … , *<sup>m</sup>*A in the same way as the combinatorial properties of every *<sup>j</sup>*B are.

I will not attempt here to make this rather vague statement precise. Under appropriate specifications it should follow from (3) that in the typical case all conjuncts are members of the same syntactic category and that each conjunct stands in the same grammatical relations to the external elements just as every other conjunct. Specifically, the Coordinate Structure Constraint with its 'Across-The-Board exception' (4) should follow from (3):

(4) *CSC/ATB*:

If there is an *<sup>i</sup>*A in a nonA-position that binds a trace in one *<sup>j</sup>*B, it binds a trace in every *<sup>k</sup>*B.

It follows, then, that each single conjunct *<sup>i</sup>*B may be substituted for the whole constituent "(& ) <sup>1</sup>B … *<sup>n</sup>*B" salva grammaticalitate. See Neijt (1979: Ch. 1) and Sag et al. (1985) for detailed discussion of symmetric coordination.<sup>1</sup>

There are, however, certain types of coordinate structures in German that are asymmetric in that they do not comply with (3) and its corollaries. Compare, e.g., (5a) and (6a):

	- b. wenn [jemand nach Hause kommt], …
	- c. wenn [da der Gerichtsvollzieher vor der Tür steht], …
	- b. \* wenn [da steht der Gerichtsvollzieher vor der Tür], …

<sup>1</sup> Split conjuncts as in (i) will not be considered here:

<sup>(</sup>i) Sie she hat has gestern yesterday einen a Hund dog gekauft bought oder or einen a Kater. cat

I will also disregard reductions such as Gapping and Right Periphery Ellipsis (alias Right Node Raising) that operate on symmetric coordinate structures.

### 7 Assumptions about asymmetric coordination in German

The coordination in (5a) is symmetric; and consequently the first conjunct (5b) or the second conjunct (5c) can be substituted for the whole coordinate structure. The coordination in (6a) is asymmetric; hence, substituting the second conjunct for the coordinate structure, as in (6b), is not possible.

There is also another type of asymmetric coordination. Compare (7a) and (8a):

	- b. wenn jemand [den Gerichtsvollzieher sieht], …
	- b. \* wenn jemand [sieht den Gerichtsvollzieher], …

The coordination in (7a) is symmetric, and the second conjunct can be substituted for the whole coordinate structure, as in (7b). The coordination in (8a) is asymmetric, and the coordinate structure cannot be replaced by the second conjunct.

In this contribution I will sketch a set of assumptions that seem jointly to be able to account for the major syntactic properties of asymmetric coordinations such as (6a) and (8a).<sup>2</sup>

### **2 German clause structure**

Traditionally three major topological types of clauses are distinguished according to the position of the finite verb. Embedded clauses typically (but not invariably) conform to the scheme (9):

(9) CMP – X – VK

where CMP corresponds to what used to be called the 'COMP-position' in English. The finite verb as well as infinite verbs (if any) are in VK. All other elements of the clause (if any) are in X. (Extraposition will be disregarded throughout.)

<sup>2</sup> For earlier inquiries into asymmetric coordination in German see Wunderlich (1988) and Höhle (1983). The latter paper was based on a talk given at Tilburg University in February, 1983. It is a pleasure to acknowledge here useful discussions I had over the years with Jan Koster, Klaus-Dirk Smolka, Craig Thiersch, Hubert Truckenbrodt, Marc van de Velde and, of course, Henk van Riemsdijk.

Ordinary declaratives and direct *wh*-interrogatives deviate from (9) in the way indicated in (10), where FINIT is the position of the finite verb and K is a *wh*phrase in the case of interrogatives and some other kind of phrase in the case of declaratives:

(10) K – FINIT – X – VK

Direct polar interrogatives, certain conditionals and concessives, and some other functional types differ from (10) in that they lack a K-position:

(11) FINIT – X – VK

To fix terminology, I dub clauses of type (9) 'E-clauses' ("E" for 'elementary'); those of type (10), 'F2-clauses'; and those of type (11), 'F1-clauses'. F1-clauses and F2-clauses are 'F-clauses', i.e., clauses where the finite verb is fronted.

As to the categorial structure of clauses, I will assume that FINIT can always be identified with I<sup>0</sup> , in one of the current conceptions of I, and that the base position of the subject is contained in Vm. In German this position can be casemarked. The abstract structure of clauses then is as given in (12). Examples are analysed accordingly in (13).

	- b. *F2-clauses*: [<sup>I</sup> <sup>2</sup> K [<sup>I</sup> 1 I 0 [V <sup>m</sup> X VK ]]]
	- c. *F1-clauses*: [<sup>I</sup> 1 I 0 [V <sup>m</sup> X VK ]]
	- b. [<sup>I</sup> <sup>2</sup> [mit wem]*<sup>i</sup>* [<sup>I</sup> <sup>1</sup> hat*<sup>j</sup>* [<sup>V</sup> <sup>m</sup> Karl gestern *t<sup>i</sup>* gesprochen *tj*]]]
	- c. [<sup>I</sup> <sup>1</sup> hat*<sup>i</sup>* has [V <sup>m</sup> Karl Karl gestern yesterday mit with dir you gesprochen spoken *ti*]]

Some of these assumptions will be modified later on.

Following arguments by Safir (1985), I will assume that the subject position of the clause is obligatory. This implies that German has an expletive *pro*, as in (14):

(14) [<sup>C</sup> <sup>m</sup> daß that [V <sup>m</sup> *pro* vielen many Leuten people.dat geholfen helped wurde]] was

I furthermore assume that the K-position in (12b) is neither governed nor casemarked. It follows correctly that ordinary declarative variants of (14) can appear as (15a–c), but not as (15d), since *pro* must be governed (and case-marked) in Sstructure:

### 7 Assumptions about asymmetric coordination in German

	- b. [<sup>I</sup> <sup>2</sup> geholfen*<sup>i</sup>* [<sup>I</sup> <sup>1</sup> wurde*<sup>j</sup>* [<sup>V</sup> <sup>m</sup> *pro* vielen Leuten *t<sup>i</sup> tj*]]]
	- c. [<sup>I</sup> <sup>2</sup> es [<sup>I</sup> <sup>1</sup> wurde*<sup>i</sup>* [<sup>V</sup> <sup>m</sup> *pro* vielen Leuten geholfen *ti*]]]
	- d. \* [<sup>I</sup> <sup>2</sup> *pro<sup>i</sup>* [<sup>I</sup> <sup>1</sup> wurde*<sup>j</sup>* [<sup>V</sup> <sup>m</sup> *t<sup>i</sup>* vielen Leuten geholfen *tj*]]]

(The *es* in (15c) is an expletive particle whose occurrence is restricted to the SpecIposition.)

With this terminology at hand we can describe asymmetric coordination in slightly more detail. In (16) (= (6a)) the first conjunct is a Vm. The second is an F2-structure, hence an I<sup>2</sup> :

(16) wenn [<sup>α</sup> [<sup>V</sup> <sup>m</sup> jemand nach Hause kommt] und [<sup>I</sup> <sup>2</sup> da [<sup>I</sup> <sup>1</sup> steht*<sup>i</sup>* [<sup>V</sup> <sup>m</sup> der Gerichtsvollzieher vor der Tür *ti*]]]]

This is unusual in two ways: First, *wenn* usually must introduce E-clauses, cf. (6b). Second, conjuncts typically are of the same category type. Coordinate structures whose conjuncts are of the same category are symmetric. Following traditional insights (e.g., Hockett 1958), I assume that in symmetric coordination each conjunct is a head of the coordinate structure. Making the natural complementary assumption for asymmetric coordination, I suggest that only the normal conjunct is a head of the coordinate structure, whereas the asymmetrically added second conjunct is a non-head. Since the category of the head and the category of the head's mother are identical, I will assume that in (16), α = Vm. Hence the combinatorial properties of *wenn* are satisfied in the way we would expect them to, in that *wenn* here is a sister of Vm. Coordinate structures with a non-head F2 conjunct I will call (asymmetric) F2-coordination.

In (17) (= (8a)) the first conjunct is a V<sup>1</sup> , hence α = V<sup>1</sup> :

(17) wenn [<sup>V</sup> <sup>m</sup> jemand [<sup>α</sup> [V1 nach Hause kommt] und [<sup>β</sup> sieht*<sup>i</sup>* [<sup>V</sup> <sup>m</sup> da den Gerichtsvollzieher *ti*]]]]

The second conjunct is similar to an F-clause, but it lacks the subject that is required by the predicate. It is not obvious whether β is I<sup>1</sup> or I<sup>2</sup> (or something else). Coordinate structures with a non-head β conjunct of this kind I will call SLFcoordination ('Subject Lacking in F-structure').

### **3 Asymmetric F2-coordination**

In (16) an F2 conjunct occurs in an E-clause. This construction is very common with conditional *wenn*-clauses and temporal *als*-clauses. With other types of E-

clauses it is less common, although there does not seem to be any type where it is strictly excluded.

Asymmetric F2-coordination is also very common with conditional F1-clauses, as in (18a), and similar types:

	- b. [<sup>I</sup> <sup>1</sup> kommst*<sup>i</sup>* [<sup>V</sup> <sup>m</sup> [<sup>V</sup> <sup>m</sup> du nach Hause *ti*] und [<sup>I</sup> <sup>2</sup> da steht der Gerichtsvollzieher vor der Tür]]]

I will assume that the coordinate structure of (18a) is basically identical with the structure of (16), i.e., I<sup>2</sup> conjoined with Vm, as shown in (18b). Notice that the first conjunct – but not the second – contains a trace nonA-bound by the finite verb *kommst*, thus violating the CSC/ATB (4). We expect this to be possible, because (4) is a corollary of the External Homogeneity Condition (3), adherence to which would constitute a defining property of symmetric coordination, not of asymmetric coordination.

With many speakers, asymmetric F2-coordination can also be observed with F2-clauses, as in the interrogative (19a):

	- b. [<sup>I</sup> <sup>2</sup> wann*<sup>j</sup>* [<sup>I</sup> <sup>1</sup> holst*<sup>i</sup>* [<sup>V</sup> <sup>m</sup> [<sup>V</sup> <sup>m</sup> du *t<sup>j</sup>* die Fahrkarten *ti*] und [I <sup>2</sup> Heinz packt sein Zeug ein]]]]

At this point one may ask why it is possible to conjoin I<sup>2</sup> and Vm. Given the fact that it is possible, in principle, to asymmetrically conjoin categories of different types, we certainly expect this possibility to be restricted in accordance with some general principle. As a minimal restriction I assume that for any kind of coordination the constituents to be conjoined must be functionally similar with respect to their degree of saturation. In German, V<sup>m</sup> and I<sup>2</sup> are completely saturated in the sense that they are complete functional complexes. In (16) this is visibly true. In (18) and (19) it is true under the assumption that nonA-bound traces as they appear there are evaluated, for the purpose under discussion, in the way that overt linguistic expressions are.

If these assumptions are correct, one may try and substitute a V<sup>m</sup> without traces for I<sup>2</sup> in (16), (18) and (19). For (16) the result of substitution is, of course, an ordinary symmetric coordination, i.e., (5a). For (18a), the result is (20):

7 Assumptions about asymmetric coordination in German

	- b. [<sup>β</sup> [<sup>β</sup> kommst du nach Hause] und [<sup>V</sup> <sup>m</sup> da der Gerichtsvollzieher vor der Tür steht]]

Why is (20) impossible? Consider some candidate structures for (20). In structure (21a) a V<sup>m</sup> is conjoined with a Vm. Conjunction of like categories is a sufficient condition for symmetric coordination, and as such (21a) would have to comply with the CSC/ATB, which it does not. This is as it should be. But it seems that (21b) must be regarded as being wellformed, according to our assumptions. If it were, we would not have an account for the unacceptability of (20). Intuitively speaking, (21b) seems to be incorrect because β (β = I<sup>1</sup> ) should be a full clause, which should not be able to be conjoined with Vm, a non-clause. If so, we have to specify assumptions that enforce this result.

To this end I would like to adopt some suggestions made by Kathol (1989). Modifying and extending ideas of Fukui & Speas (1986) and Travis (1988), he proposes the set of assumptions (22):

	- ii. In German, I<sup>0</sup> is empty if and only if I<sup>1</sup> is a sister of C<sup>0</sup> .
	- iii. In German, I<sup>0</sup> contains a lexical element if and only if there is a SpecI, i.e., I<sup>1</sup> projects to I<sup>2</sup> .

From (22i,ii) it follows that E-clauses must contain an empty I<sup>0</sup> , and from (22iii) it follows that in F1-clauses the finite verb is in C<sup>0</sup> , with I<sup>0</sup> empty. (12a,b) must then be replaced by (23a,b):

(23) a. *E-clauses*: [<sup>C</sup> <sup>m</sup> CMP [<sup>I</sup> 1 I 0 [V <sup>m</sup> X VK]]] b. *F1-clauses*: [<sup>C</sup> <sup>m</sup> C 0 [I 1 I 0 [V <sup>m</sup> X VK]]]

I will assume, furthermore, that the special semantic properties of F1-clauses – i.e., their being conditionals, direct polar interrogatives, etc. – are associated somehow with the verb being in C<sup>0</sup> .

Under these assumptions (21b) is impossible, as it does not comply with (22i). We have now to consider two new structures for (20):

(24) a. [<sup>C</sup> <sup>1</sup> kommst*<sup>i</sup>* [<sup>I</sup> <sup>1</sup> [<sup>I</sup> <sup>1</sup> *e<sup>i</sup>* [<sup>V</sup> <sup>m</sup> du nach Hause *ti*]] und [<sup>I</sup> <sup>1</sup> *e* [<sup>V</sup> <sup>m</sup> da der Gerichtsvollzieher vor der Tür steht]]]]

b. [<sup>C</sup> <sup>1</sup> [<sup>C</sup> <sup>1</sup> kommst du nach Hause] und [<sup>I</sup> <sup>1</sup> *e* [<sup>V</sup> <sup>m</sup> da der Gerichtsvollzieher vor der Tür steht]]]

Structure (24a) is ungrammatical as it violates the CSC/ATB. (24b) does not comply with (22ii), thus accounting for the intuition that the conjunction of the nonclause I<sup>1</sup> with the full clause C<sup>1</sup> is the source of this structure's ungrammaticality. With (21) and (24) the set of potential candidate structures for (20) is not exhausted, of course, but one can easily see how other structures fail to be grammatical.

Basically the same results obtain when V<sup>m</sup> is substituted for I<sup>2</sup> in (19):

	- b. wann*<sup>i</sup>* [<sup>I</sup> <sup>1</sup> holst*<sup>j</sup>* [<sup>V</sup> <sup>m</sup> [<sup>V</sup> <sup>m</sup> du *t<sup>i</sup>* die Fahrkarten *tj*] und [<sup>V</sup> <sup>m</sup> Heinz sein Zeug einpackt]]]
	- c. wann*<sup>i</sup>* [<sup>I</sup> <sup>1</sup> holst*<sup>j</sup>* [<sup>V</sup> <sup>m</sup> [<sup>V</sup> <sup>m</sup> du *t<sup>i</sup>* die Fahrkarten *tj*] und [<sup>I</sup> <sup>1</sup> *e* [<sup>V</sup> <sup>m</sup> Heinz sein Zeug einpackt]]]]
	- d. wann*<sup>i</sup>* [<sup>I</sup> 1 [I <sup>1</sup> holst du *t<sup>i</sup>* die Fahrkarten] und [<sup>I</sup> <sup>1</sup> *e* [<sup>V</sup> <sup>m</sup> Heinz sein Zeug einpackt]]]

Structure (25b) is a CSC/ATB violation. Both (25c) and (25d) are in violation of (22ii). In addition, (25d) is a CSC/ATB violation.<sup>3</sup>

Much like an F2-clause (i.e., an I<sup>2</sup> ) and a Vm, a full F1-clause constitutes a complete functional complex. When we substitute an F1-clause for I<sup>2</sup> in asymmetric coordinations, we get examples such as (26):

(26) a. \* als when Karl Karl nach to Hause home kam came und and stand stood da there sein his Vater father vor at der the Tür, … door

	- b. \* Wann holst du die Fahrkarten und [<sup>α</sup> dein Zeug einpackst]?
	- c. \* Vielleicht perhaps holt gets er he die the Fahrkarten tickets und and [<sup>α</sup> sein his Zeug stuff einpackt]. up.packs

<sup>3</sup>The same is true, of course, when the subject of V<sup>m</sup> is lacking:

Under any analysis of examples like these (with α = V<sup>1</sup> , V<sup>m</sup> or I<sup>1</sup> ) we get either a symmetric coordination violating the CSC/ATB, or a violation of (22ii), or both. This is in contrast with wellformed SLF-coordinations such as (29)–(31) below.

7 Assumptions about asymmetric coordination in German


None of these examples is a wellformed asymmetric coordination. An F1-conjunct within an E-clause as in (26a) is strongly unacceptable. An F1-conjunct within an F1-structure as in (26b) is unobjectionable; but this is an ordinary (symmetric) coordination of two conditional F1-clauses, just as (27) is a (symmetric) coordination of two conditional *wenn*-clauses:<sup>4</sup>

(27) [[wenn when Karl to nach Karl Hause home kommt] comes und and [wenn when da there sein his Vater father vor at der the Tür door steht]], stands …

The structure of (26c) is an ordinary symmetric coordination of two I<sup>1</sup> -conjuncts, as shown in (28):

(28) wann*<sup>i</sup>* [<sup>I</sup> 1 [I <sup>1</sup> holt Karl *t<sup>i</sup>* die Fahrkarten] und [<sup>I</sup> <sup>1</sup> packt Heinz *t<sup>i</sup>* sein Zeug ein]]

There is no reason whatsoever for assuming an asymmetric coordinate structure for (26c).

Why is it that full F1-clauses, as opposed to F2-structures such as (16), (18) and (19), cannot be asymmetrically conjoined with Vm? The reason, I propose, is the special semantics associated with the structure of F1-clauses. When we try and give (26) analyses in accordance with (23b), the second conjunct will always be a C 1 . That C<sup>1</sup> conjunct must receive the interpretation of a conditional (or a direct polar interrogative, and so on), but there is of course no way of integrating this interpretation into the containing structure of (26a) and (26c). The only way of integrating it into (26b) is by assuming that the first conjunct is a C<sup>1</sup> . There are exactly two possible structures for full F1 expressions: they can be analysed as a C 1 clause, as in (26b), or as an I<sup>1</sup> which according to (22iii) must project to I<sup>2</sup> , as in (28). Hence there is no asymmetric F1-coordination.

<sup>4</sup>One might expect that coordination of a conditional *wenn*-clause and a conditional F1-clause, as in (i), should be possible in the way of (26b) and (27). For reasons unknown, however, (i) is bad:

<sup>(</sup>i) a. \* [[kommt comes Karl Karl nach to Hause] home und and [wenn when da there sein his Vater father vor at der the Tür door steht]], stands …

b. \* [[wenn Karl nach Hause kommt] und [steht da sein Vater vor der Tür]], …

### **4 SLF-coordination**

In (29) (= (17)) an SLF-conjunct occurs in an E-clause:

	- b. [<sup>C</sup> <sup>m</sup> wenn [<sup>I</sup> <sup>1</sup> *e* [<sup>V</sup> <sup>m</sup> jemand [<sup>V</sup> <sup>1</sup> [<sup>V</sup> <sup>1</sup> nach Hause kommt] und [<sup>β</sup> sieht*<sup>i</sup>* [V <sup>m</sup> da den Gerichtsvollzieher *ti*]]]]]]

Just like asymmetric F2-coordination, SLF-coordination also occurs in F1-clauses, as in (30), and in F2-clauses, as in (31):

	- b. [<sup>C</sup> <sup>1</sup> kommst*<sup>i</sup>* [<sup>I</sup> <sup>1</sup> *e<sup>i</sup>* [<sup>V</sup> <sup>m</sup> du [<sup>V</sup> <sup>1</sup> [<sup>V</sup> <sup>1</sup> nach Hause *ti*] und [<sup>β</sup> siehst*<sup>j</sup>* [V <sup>m</sup> da den Gerichtsvollzieher *tj*]]]]]]
	- b. [<sup>I</sup> <sup>2</sup> hoffentlich [<sup>I</sup> <sup>1</sup> kommt*<sup>i</sup>* [<sup>V</sup> <sup>m</sup> keiner [<sup>V</sup> <sup>1</sup> [<sup>V</sup> <sup>1</sup> nach Hause *ti*] und [<sup>β</sup> sieht*<sup>j</sup>* [<sup>V</sup> <sup>m</sup> da den Gerichtsvollzieher *tj*]]]]]]

The structures given under (29b), (30b), (31b) are based on the assumption that constituents can only be (symmetrically or asymmetrically) conjoined if they are similar with respect to their degree of saturation. The β conjunct in each case is unsaturated with respect to its grammatical subject; hence, I assume, it must be conjoined with a constituent that is similarly unsaturated, i.e., with V<sup>1</sup> .

The assumption that the coordinate structure as a whole is a V<sup>1</sup> is confirmed by recursive embedding of coordinate structures such as (32):

(32) a. wenn when jemand someone [<sup>α</sup> in into die the Wüste desert zieht moves und and lebt lives dort there von off Heuschrecken] locusts oder or [<sup>α</sup> sich himself im in.the Wald wood verirrt lost hat has und and nährt nourishes sich himself von from Wurzeln roots und and Beeren], berries …

### 7 Assumptions about asymmetric coordination in German

b. Vielleicht perhaps hat has Karl Karl [<sup>α</sup> den the Kindern children ein a Buch book geschenkt given und and liest reads ihnen them jetzt now daraus it.from vor] out oder or [<sup>α</sup> seinen his Eltern parents ein a Radio radio gekauft bought und and erklärt explains ihnen them jetzt, now wie how es it funktioniert]. works

Here the conjuncts are of the form [<sup>α</sup> V <sup>1</sup> *und* β]; hence α = V<sup>1</sup> .

As for the identity of β, it might seem possible that β = I<sup>2</sup> . We would then have to assume that the K-position is somehow ellipsed under identity with the subject of the first conjunct, or that it is occupied by a PRO which is controlled by that subject. Note, however, that the notion of ellipsis or controlled PRO is not identical with the notion of unsaturatedness that I appealed to above. It is not obvious, therefore, why an I<sup>2</sup> conjunct should be conjoined with V<sup>1</sup> as opposed to, say, V<sup>m</sup> or I<sup>1</sup> , whereas this follows naturally from the assumption that β is unsaturated in the same way as V<sup>1</sup> is.

The assumption that β = I<sup>2</sup> might be based on the existence of examples such as (33):

(33) a. [you] bist are ja heute today mal once pünktlich. on.time

> b. [we/they] sind are grade just erst now angekommen. arrived

Under appropriate conditions unembedded sentences like these can be used as declaratives. They clearly are F2-clauses with a non-overt K-position; and as they are lacking an overt subject, we must assume that the subject (i) is represented by PRO in the K-position, or (ii) occupies the K-position in S-structure, but is ellipsed at surface structure. However, this same construction type provides strong evidence against the assumption that β = I<sup>2</sup> . Not only subjects, but many different types of constituents can be ellipsed in the K-position, e.g., an object, as in (34):

(34) \_\_\_ [that] finde find ich I nicht. not

None of these types can occur in asymmetric coordinations. Compare, e.g., the impossible object ellipsis in (35) with the wellformed SLF-coordination in (36):

	- b. \* Vielleicht perhaps sucht looks.for sie she den the Hund dog und and findet finds sie she nicht. not

	- b. Vielleicht perhaps sucht looks.for sie she den the Hund dog und and findet finds ihn him nicht. not

It is exclusively the subject that can be lacking in asymmetric conjuncts. Assuming that β = I<sup>2</sup> does not even provide a basis for expressing this fact; much less does it suggest a principled account for it. I conclude from this that β = I<sup>1</sup> .

If this conclusion is correct, this is a case where I<sup>1</sup> with a non-empty I<sup>0</sup> does not project to I<sup>2</sup> , thus falsifying (22iii). There are various possibilities for resolving this conflict. I would like to suggest here that (22iii), although it is slightly too strong as it stands, is correct in implying that I<sup>1</sup> with a lexically filled head position is looking for something to complete it. Thus I assume that (22iii) may be replaced by (37):

(37) In German, I<sup>0</sup> contains a lexical element if and only if there is an argument of which I<sup>1</sup> is predicated, or there is a specifier position of I<sup>1</sup> .

But how is it possible for I<sup>1</sup> to be unsaturated, i.e., to be a predicative category? Recall that I<sup>0</sup> must be a sister of V<sup>m</sup> and that the subject position in V<sup>m</sup> is obligatory. In SLF-conjuncts, the subject position is empty. What kind of empty category does it represent?

The answer is provided by a modification of case theory and theta theory. Notice that the theta theory proposed by Chomsky (1982: 333ff) has two interrelated special characteristics. It assumes that a position can be theta-marked without being case-marked and furthermore, that a subject argument may get its theta-role by two different mechanisms, i.e., by predication or by transmission mediated by NP trace. I suggest that these assumptions be replaced by (38):<sup>5</sup>

	- ii. If in a given constituent a theta-role R cannot be assigned, R must be externalized.
	- iii. A constituent can assign at most one external theta-role.
	- iv. Assignment of structural case is optional.

For an illustration, consider some examples:

<sup>5</sup>This modification may also contribute to a principled account for certain properties of infinitival constructions in German, which I cannot discuss here. See also Williams (1987) for a similar set of assumptions. As for the position of PRO, I will leave open here whether it should be exempted from (38i) or whether it should be case-marked.

7 Assumptions about asymmetric coordination in German

	- b. Dich<sup>i</sup> you [I <sup>1</sup> hat*<sup>j</sup>* [I <sup>1</sup> has [V <sup>m</sup> Karl Karl [V <sup>1</sup> *e<sup>i</sup>* beobachtet watched *tj*]]]
	- c. \* *e<sup>i</sup>* [<sup>I</sup> <sup>1</sup> hat*<sup>j</sup>* [<sup>V</sup> <sup>m</sup> Karl [<sup>V</sup> <sup>1</sup> *e<sup>i</sup>* beobachtet *tj*]]]
	- d. Karl*<sup>i</sup>* [<sup>I</sup> <sup>1</sup> hat*<sup>j</sup>* [<sup>V</sup> <sup>m</sup> *e<sup>i</sup>* [<sup>V</sup> <sup>1</sup> dich beobachtet *tj*]]]
	- e. \* *e<sup>i</sup>* [<sup>I</sup> <sup>1</sup> hat*<sup>j</sup>* [<sup>V</sup> <sup>m</sup> *e<sup>i</sup>* [<sup>V</sup> <sup>1</sup> dich beobachtet *tj*]]]

In (39a), assume that the position of *e* is not case-marked, hence not theta-marked. Then the object theta-role of *beobacht*- 'watch' must be externalized. But the subject theta-role must also be externalized, yielding a violation of (38iii). For the same reasons (39b) is ungrammatical if the position of *e* is not case-marked; it is grammatical if the positions of *Karl* and *e* are case-marked (and hence thetamarked). (39c), again, is ungrammatical according to (38iii) if the second *e* position is not case-marked. If it is case-marked, it is ungrammatical, too, because the first *e*, although it correctly nonA-binds the second *e*, would have to be nonAbound by itself. (39d) is grammatical if (and only if) the position of *e* is casemarked. If the subject position of (39e) is case-marked, it is ungrammatical because its nonA-binder would have to be nonA-bound by itself. If it is not casemarked, and hence not theta-marked, the subject theta-role must be externalized. I assume that a projection of I (but not, e.g., of C) is able to take up and externalize a theta-role that a daughter constituent seeks to assign. But in (39e) there is no case-marked position that the theta-role can be assigned to by I<sup>1</sup> .

In German, nominative assignment by I<sup>0</sup> is to the right (if there is any); hence the SpecI-position is a nonA-position. In English, nominative assignment by I<sup>0</sup> is to the left. Hence the subject position in V<sup>m</sup> cannot be case-marked, and *John* in (40) must receive case in the SpecI-position:

(40) [<sup>I</sup> <sup>2</sup> John*<sup>i</sup>* [<sup>I</sup> <sup>1</sup> may [<sup>V</sup> <sup>m</sup> *e<sup>i</sup>* follow you]]]

The subject theta-role cannot be assigned to the position of *e*; it must be assigned by I<sup>1</sup> to the SpecI-position. In English, hence, the SpecI-position is an A-position. Application of (38) to SLF-coordination is straightforward. Consider (41):

	- b. [<sup>I</sup> <sup>2</sup> vielleicht [<sup>I</sup> <sup>1</sup> sucht*<sup>i</sup>* [<sup>V</sup> <sup>m</sup> Karl*<sup>j</sup>* [<sup>V</sup> <sup>1</sup> [<sup>V</sup> <sup>1</sup> den Hund *ti*] und [<sup>I</sup> <sup>1</sup> findet*<sup>k</sup>* [<sup>V</sup> <sup>m</sup> *e<sup>j</sup>* ihn nicht *tk*]]]]]]

Assume that the empty subject position is case-marked, hence theta-marked. Under the given coindexation *e* is A-bound by *Karl* and the structure is ungrammatical. Assume instead that *e* is not case-marked. Then the subject theta-role must be externalized, and the I<sup>1</sup> conjunct must assign it to a case-marked position, much like the English I<sup>1</sup> regularly does; cf. (40). Hence, both the (first) V<sup>1</sup> conjunct and the (second) I<sup>1</sup> conjunct assign a theta-role to the position of *Karl*, just like the two V<sup>1</sup> conjuncts in the symmetric coordination (42) do:<sup>6</sup>

(42) [<sup>C</sup> <sup>m</sup> wenn [<sup>I</sup> <sup>1</sup> *e* [<sup>V</sup> <sup>m</sup> Karl [<sup>V</sup> <sup>1</sup> [<sup>V</sup> <sup>1</sup> den Hund sucht] und [<sup>V</sup> <sup>1</sup> ihn nicht findet]]]]]

The assumptions (38), then, allow us to see how it is possible for an I<sup>1</sup> conjunct to be a predicative category and why it is exclusively the subject that can (and must) be lacking in an asymmetric I<sup>1</sup> -conjunct.<sup>7</sup>

Given that an SLF-conjunct is an I<sup>1</sup> and that, in general, extraction out of I<sup>1</sup> (as opposed to I<sup>2</sup> ) is possible, the question arises why extraction out of an SLFconjunct is impossible. Consider (43) and (44):

	- b. [seine Bücher]*<sup>i</sup>* [<sup>I</sup> <sup>1</sup> verkaufte*<sup>j</sup>* [<sup>V</sup> <sup>m</sup> er*<sup>k</sup>* [<sup>V</sup> <sup>1</sup> [<sup>V</sup> <sup>1</sup> *t<sup>i</sup> tj*] und [<sup>I</sup> <sup>1</sup> wandte*<sup>l</sup>* [<sup>V</sup> <sup>m</sup> *e<sup>k</sup>* sich der Malerei zu *tl*]]]]]
	- b. [seine Bücher]*<sup>i</sup>* [<sup>I</sup> <sup>1</sup> wandte*<sup>l</sup>* [<sup>V</sup> <sup>m</sup> er*<sup>k</sup>* [<sup>V</sup> <sup>1</sup> [<sup>V</sup> <sup>1</sup> sich der Malerei zu *tl*] und [I <sup>1</sup> verkaufte*<sup>j</sup>* [<sup>V</sup> <sup>m</sup> *e<sup>k</sup>* [<sup>V</sup> <sup>1</sup> *t<sup>i</sup> tj*]]]]]]

In (43) the object *seine Bücher* 'his books' is extracted out of the (first) V<sup>1</sup> -conjunct, hence out of the containing I<sup>1</sup> . A violation of the CSC/ATB such as this is


<sup>6</sup>This is not a violation of the theta-criterion as proposed in Chomsky (1982: 335), since in (42) as well as in (41) the position of *Karl* is the only position involved in the relevant chains that is theta-marked, according to (38).

<sup>7</sup> I assume that an I<sup>2</sup> is fundamentally different from an I<sup>1</sup> in that the former, being a 'closed' projection of a functional category, is in principle unable to assign an external theta-role. It follows correctly that in an F2-structure the subject cannot be missing; cf. (i) vs. (ii):

### 7 Assumptions about asymmetric coordination in German

unobjectionable with asymmetric coordination. But when the order of conjuncts is reversed, as in (44), the result is strongly unacceptable.

There seems to be a simple reason for this asymmetry. We naturally expect a head conjunct to behave just as it would if it were substituted for the whole coordinate structure; hence extraction out of a head conjunct, as in (43), is possible. A non-head conjunct cannot be substituted for the whole coordinate structure. Extraction out of a non-head constituent *α*, in general, is possible only if α is governed. But there is nothing within a coordinate structure that a conjunct could be governed by. Hence, extraction out of a non-head conjunct, as in (44), is impossible.<sup>8</sup>

### **References**


Hockett, Charles F. 1958. *A course in modern linguistics*. New York: Macmillan.

Höhle, Tilman N. 1983. *Subjektlücken in Koordinationen*. Ms. Köln. [Chapter 4 in this volume, pp. 193–218].

Kathol, Andreas. 1989. *V2 and licensing in German*. Ms. [revised version appeared as: A uniform approach to V2 in German. In Juli Carter et al. (eds.), *Proceedings of NELS 20, vol. 1*, 244–245. Amherst, Ma. 1990.]


	- b. \* [Die Akten]*<sup>i</sup>* nahm er *t<sup>i</sup>* mit ins Büro und zeigte *e<sup>i</sup>* seinen Kollegen.

<sup>8</sup>One might expect parasitic gaps to occur in SLF-conjuncts, but they do not:

Unfortunately, it is difficult to ascertain whether this is a special property of SLF-conjuncts requiring special explanation, since parasitic gap constructions of the kind known from SVO languages do not occur in German anyway.


### **Chapter 8**

## **On reconstruction and coordination**

Tilman N. Höhle

### **0 Overview<sup>∗</sup>**

This article is concerned with the evaluation of Ā-bound empty categories on the one hand, and with aspects of the theory of coordination on the other. As Koster (1987) urged, the way bound categories are evaluated should be deducible from the general principle 'Share Property' in conjunction with other universal principles (and, perhaps, learnable properties of particular languages). Clearly, this idea constitutes a research program rather than an articulated theory. The observations discussed in Section 3 through Section 6 are meant to contribute to this research program.

One main problem in the evaluation of traces are phenomena falling under the rubric of 'reconstruction'. When a clause contains a dislocated phrase, such as *this fool* in *this fool I can't stand*, certain conditions on well-formedness and/ or interpretation seem to lead to incorrect predictions, or not be applicable at all when applied at S-structure. There are two approaches to this problem in the literature: (i) one may restrict the application of those conditions to a level of representation distinct from S-structure (true reconstruction), or (ii) one may

<sup>∗</sup> I am grateful to two anonymous referees and to the editors, who prompted me to rework an earlier version of this article ("Scope assignment and binding by reconstruction") that did not contain the discussion of Section 6. Thanks are due to Werner Frey, Jürgen Pafel, Arnim von Stechow, and Craig Thiersch for important discussion.

Tilman N. Höhle. 2019. On reconstruction and coordination. In Stefan Müller, Marga Reis & Frank Richter (eds.), *Beiträge zur deutschen Grammatik. Gesammelte Schriften von Tilman N. Höhle. Second revised edition*, 311–368. Berlin: Language Science Press. DOI:10.5281/zenodo.2588361

<sup>§</sup> *Editors' note:* This paper was originally published in Haider, Hubert & Klaus Netter (eds.). 1991. *Representation and derivation in the theory of grammar* (Studies in Natural Language and Linguistic Theory 22), 139-197. Dordrecht: Kluwer. The layout and citation style have been adapted to the format chosen for the present volume.

extend the definition of those conditions in such a way that they can be applied correctly at S-structure (pseudo-reconstruction). Although (i) and (ii) are widely believed to be empirically equivalent, observations on coordination suggest that they are not, in that (ii) is incompatible with standard assumptions about how coordinate structures are translated into a semantic representation. Hence either (i) is correct, or the theory of translation must be modified.

The presentation proceeds as follows. As a general background the fundamentals of the theory of coordination are reviewed in Section 1, and the results are used in Section 2 to establish the most basic properties of German clause structure. In Section 3 some observations on scope and binding properties of dislocated phrases such as alluded to above are displayed, and in Section 4 the two approaches to reconstruction are spelled out. A discussion of coordination and its implications follows in Section 5. On the basis of a number of considerations, among which parasitic gaps figure importantly, I conclude in Section 6 that (i) – true reconstruction – cannot be correct.

### **1 Theory of coordination**

The theory of coordination that I assume is largely that of Neijt (1979: Chapter 1). Its main characteristics will be recapitulated in the sections to follow.

### **1.1 Symmetric coordination, unreduced**

Consider an S-structure configuration such as (1):

$$\text{V}\_{\text{w}} \dots \text{V}\_{\text{l}+\text{g}} \text{ R}\_{\text{u}} \text{ } \text{\(\text{\(\beta\)}\) V} \\ \text{v} \dots \text{v} \\ \text{\(\beta\)} \text{ V}\_{\text{l}} \text{ } \text{\(\beta\)}$$

where each *<sup>i</sup>*B is a conjunct, each & is a coordinating element (e.g., a particle such as *und* 'and', *oder* 'or', *noch* 'nor'), and each *<sup>i</sup>*A is an element external to the conjuncts (*m ≥* 0; *n ≥* 2). The fundamental principle is then (2):

	- i. whose structure and whose combinatorial properties follow from general rules that are independent from coordination, or
	- ii. which conforms to the coordination scheme (1).

In examples such as (3) the properties of the conjuncts indicated by brackets follow from rules independent from coordination, in accordance with (2i):

8 On reconstruction and coordination

	- b. sie she hofft, hopes daß that weder neither [Maria Maria arbeitet] works noch nor [Hanna Hanna nachdenkt] meditates 'she hopes that neither Maria works nor Hanna meditates'

In an example such as (4) the conjuncts themselves are coordinate structures in accordance with (2ii):

(4) sie hofft, daß weder [Karl arbeitet oder Heinz nachdenkt] noch [Maria arbeitet oder Hanna nachdenkt]

'she hopes that neither Karl works or Heinz meditates, nor Maria works or Hanna meditates'

Recursive embedding of coordinate structures within coordinate structures as seen here is naturally accounted for by the assumption that the string "(&) <sup>1</sup>B … & *<sup>n</sup>*B" in (1) is a constituent, which I will refer to as a 'coordinate phrase'.

For symmetric coordination – which is the only type of coordination that we will consider here – also some principle like (5) holds:

(5) *External Homogeneity Condition:*

The combinatorial properties of each *<sup>i</sup>*B are satisfied by <sup>1</sup>A, … , *<sup>m</sup>*A in the same way as the combinatorial properties of every other *<sup>j</sup>*B are.

We will not attempt to make this rather vague statement precise. Under appropriate specifications, it should follow from (5) that in the typical case all conjuncts are members of the same syntactic category and that each conjunct stands in the same grammatical relation to the external elements as every other conjunct. Specifically, the Coordinate Structure Constraint with its 'Across-The-Board exception' (6) should follow from (5):

(6) *CSC/ATB:*

If there is an *<sup>i</sup>*A in a Ā-position that binds a trace in one *<sup>j</sup>*B, it binds a trace in every *<sup>k</sup>*B.

It should follow, then, that each single conjunct *<sup>i</sup>*B may be substituted for the whole coordinate phrase *salva grammaticalitate*. For example, (7) conforms to

(6), and the substitutions in (8) are possible, whereas (9) does not conform to (6) and the substitutions in (10) are impossible:<sup>1</sup>

(7) a. [den the Vorschlag]*<sup>i</sup>* proposal [[unterstützen support viele *ti*] many und and [lehnt rejects kaum hardly einer *t<sup>i</sup>* one ab]] off

'many support the proposal and hardly anyone rejects it'

	- b. i. ich weiß nicht, [welchen Vorschlag]*<sup>i</sup>* [viele *t<sup>i</sup>* unterstützen] ii. ich weiß nicht, [welchen Vorschlag]*<sup>i</sup>* [kaum einer *t<sup>i</sup>* ablehnt]
	- b. \* ich weiß nicht, [welchen Vorschlag]*<sup>i</sup>* [[viele *t<sup>i</sup>* unterstützen] und [kaum einer zuhört]]
	- b. \* ich weiß nicht, [welchen Vorschlag] [kaum einer zuhört]

	- b. John and Bill are nice (\*John are nice)
	- c. John and Bill will both be decorated (\*John will both be decorated)

There are also some types of coordinate structures not conforming to (5) and its corollaries, which consequently are 'asymmetric' coordinations. See Höhle (1990) for asymmetric coordination in German, and Entjes (1972) on Dutch.

Split coordinations such as (ii) will not be considered here:

(ii) sie she hat has gestern yesterday einen a Hund dog gekauft bought oder or eine a Katze cat 'she bought a dog yesterday, or a cat'

<sup>1</sup>There are some exceptions to substitutivity, the most conspicuous case being NPs coordinated by *and* in an environment requiring a plural NP, as in (i):

8 On reconstruction and coordination

### **1.2 Reductions**

Naturally the Conservation Condition (2) and its corollaries are only true of a level of representation where no construction specific ellipsis has taken place. There are two types of ellipsis specific for (symmetric) coordination in German:

(11) *Right Periphery Ellipsis (RPE):*

In some *<sup>i</sup>*B a string at the right periphery is ellipsed at surface structure under phonological and sense identity with a string at the right periphery of the final conjunct *<sup>n</sup>*B.

(12) *Gapping:*

In some *<sup>i</sup>*B an independent verb is ellipsed (possibly together with certain other elements of the same conjunct) at surface structure under sense identity with corresponding elements in the initial conjunct <sup>1</sup>B.

RPE licenses examples such as (13):

	- b. [Heinz Heinz hört hears dir you \_\_\_] und and [Karl Karl hört hears mir me zu] to 'Heinz listens to you and Karl listens to me'

The conjuncts *Heinz sollte den Hund* in (13a) and *Heinz hört dir* in (13b) do not conform to clause (i) of the Conservation Condition (2), in that constituents like these are ungrammatical unless licensed by RPE.

Similarly for Gapping:

	- b. [wen whom sollte should sie she suchen] seek und and [wen whom \_\_\_ er he \_\_\_]

'whom should she look for and whom should he look for'

Again, constituents such as *geschrien Heinz* in (14a) and *wen er* in (14b) are ungrammatical unless licensed by Gapping (or as a kind of elliptical response in discourse). (Note by the way that there are two nonadjacent elision sites in (14b),

as a consequence of the fact that a dependent (non-finite) verb may be gapped in tandem with the finite verb.)

Both RPE and Gapping are optional, of course. But in structures with multiple conjuncts an analogue to the External Homogeneity Condition (5) can be observed to hold:

(15) *Internal Homogeneity Condition:*

If in a conjunct *<sup>i</sup>*B there is an elision site licensed by an expression contained in a conjunct *<sup>j</sup>*B, then there is a corresponding elision site in each conjunct *<sup>k</sup>*B (*k ̸*= *i*), where *<sup>k</sup>*B is a sister of *<sup>j</sup>*B.

Elision sites may be licensed by RPE or by Gapping. Consider first Gapping:

	- b. \* [Karl füttert den Hund], [Heinz \_\_\_ den Kater] oder [Walter füttert den Ochsen]
	- c. \* [Karl füttert den Hund], [Heinz füttert den Kater] oder [Walter \_\_\_ den Ochsen]

If interpreted as a ternary coordination with *oder* 'or', all non-initial conjuncts must contain a Gapping site. Similarly for RPE:

	- b. \* [Karl füttert den Hund], [Heinz tränkt \_\_\_] oder [Walter streichelt den Hund]
	- c. \* [Karl füttert \_\_\_], [Heinz tränkt den Hund] oder [Walter streichelt den Hund]

The two Homogeneity Conditions (5) and (15), taken together, account for restrictions on elision in conjuncts that are coordinate phrases. Consider (18a):

8 On reconstruction and coordination

	- b. [[Karl füttert den Hund] und [Heinz \_\_\_ den Kater]] oder [Walter füttert den Ochsen]

'[Karl feeds the dog and Heinz feeds the cat], or Walter feeds the ox'

c. \* [Karl füttert den Hund] und [[Heinz \_\_\_ den Kater] oder [Walter füttert den Ochsen]]

'Karl feeds the dog, and [Heinz feeds the cat or Walter feeds the ox]'

This string of conjuncts can be interpreted as (18b), where no condition on elision is violated. But it cannot be interpreted as (18c): although the structure conforms to (12) and (15), it does not conform to (5), in that the combinatorial properties of the conjunct *Heinz den Kater* are dependent on the conjunct *Karl füttert den Hund*, whereas those of the conjunct *Walter füttert den Ochsen* are not. Consider also (19a):

	- b. [Karl füttert den Hund] und [[Heinz füttert den Kater] oder [Walter \_\_\_ den Ochsen]]

'Karl feeds the dog, and [Heinz feeds the cat or Walter feeds the ox]'

c. \* [[Karl füttert den Hund) und [Heinz füttert den Kater]] oder [Walter \_\_\_ den Ochsen]

'[Karl feeds the dog and Heinz feeds the cat], or Walter feeds the ox'

Here the interpretation (19b) does not violate any condition. The structure of (19c) conforms to (12), but it violates (15): there is an elision site in the last conjunct, licensed by *füttert* in the conjunct *Karl füttert den Hund*, but the sister of the latter conjunct does not contain an elision site. Finally, consider (20a):

	- b. [[Karl füttert den Hund] und [Heinz \_\_\_ den Kater]] oder [Walter \_\_\_ den Ochsen]

'[Karl feeds the dog and Heinz feeds the cat], or Walter feeds the ox'

c. [Karl füttert den Hund] und [[Heinz \_\_\_ den Kater] oder [Walter \_\_\_ den Ochsen]]

'Karl feeds the dog, and [Heinz feeds the cat or Walter feeds the ox]'

As expected, (20a) is ambiguous between (20b) and (20c), since none of these violates any condition. When we compare (20c) with (18c) we can see that (5) induces a CSC/ATB effect on reductions. Comparing (20b) with (18b) and (19c) we can see that the reduction in the last conjunct *Walter den Ochsen* is parasitic upon the reduction in the conjunct *Heinz den Kater*, as required by (15). (For RPE similar sets of examples can easily be constructed.)

As long as only RPE or Gapping is applied within a coordinate structure, at least one conjunct (the final one or the initial one) must conform to the Conservation Condition. But RPE and Gapping may act independently of one another with the result that no unreduced conjunct remains:

(21) [Karl Karl hört hears dir you ], [Heinz Heinz mir me ] oder or [Walter Walter ihr her zu] to

'Karl listens to you, Heinz listens to me, or Walter listens to her'

Here the initial conjunct contains an RPE site licensed by *zu* in the final conjunct, and the final conjunct contains a Gapping site licensed by *hört* in the initial conjunct. Because of the Internal Homogeneity Condition the middle conjunct has to contain a Gapping site as well as an RPE site.

Despite considerable analytical efforts, the nature of the constraints that Gapping is known to obey has to a large degree remained something of a mystery; see, for example, Kohrt (1976) and Neijt (1979). RPE – which also goes under the names of Left Deletion, Shared Constituent Coordination, Backward Conjunction Reduction, Backward Gapping and Right Node Raising – is special in its own way. It allows parts of words to be ellipsed:

(22) [Karl Karl suchte seeked den the Ein ] in und and [Heinz Heinz suchte seeked den the Ausgang] outway

'Karl looked for the entry and Heinz looked for the exit'

(For details see Toman (1985: §4), Höhle (1985) and Neijt (1987).) It also allows non-constituents to be ellipsed. In (23), for example, the converb (the so-called 'separable verb prefix') *ein* and the N<sup>0</sup> *Lösung* are ellipsed, which can never form a constituent:<sup>2</sup>

<sup>2</sup>To be more exact, the converb here presumably is a sister of a verbal trace (cf. Section 2) with which it forms a constituent, a verbal projection *V i* . Since the count noun *Lösung* cannot function as an NP by itself, it cannot be a sister of that *V i* . Rather it must be part of the NP *eine großzügige Lösung*, which in turn is part of a PP introduced by *für*.

Note incidentally that German has a null N<sup>1</sup> anaphor, similar to the English N<sup>1</sup> anaphor *one*, as in (i):

8 On reconstruction and coordination

(23) [Karl Karl tritt steps für for eine a großzügige generous \_\_\_] und and [Heinz Heinz tritt steps für for eine a sparsame parsimonious Lösung ein] solution in 'Karl pleads for a generous solution, and Heinz pleads for a parsimonious solution'

RPE in fact disobeys all (or nearly all) of the core constraints on movement rules; see Neijt (1979). In sum, RPE presumably is a process in the PF component, relating S-structure and surface structure.<sup>3</sup>

### **1.3 'Forward Conjunction Reduction'**

Principles like (2) and (5) and reductions like (11) and (12) have, of course, been assumed ever since coordination has been a topic of theoretical scrutiny. The one assumption that distinguishes the present theory from most of its predecessors (as, for example, ch. 6 of Stockwell et al. (1973) and Terazu (1975)) and also from some more recent contributions (e.g., van Oirsouw (1985) and Goodall (1987)) is (24):

(24) There is no type of elision specific to coordination other than those specified in (11) and (12).

This means, specifically, that there is no general rule of Forward Conjunction Reduction (FCR, alias Right Deletion, Coordinate Deletion or Left Peripheral Deletion), which has been hypothesized to be basically something like the mirror image of RPE in that it deletes a string at the left periphery of some conjunct *<sup>i</sup>*B

(i) die the großen big Hunde dogs haben have die the kleinen little \_\_\_ gebissen bitten 'the big dogs bit the little ones'

Nevertheless, the elision of *Lösung* in (23) cannot be an instance of the null anaphor but must be a consequence of RPE. (23) can be used as an answer to the question "What proposals are being made?". In the same context also (ii), without RPE, could be used as an answer, but (iii), with a null N<sup>1</sup> , would be uninterpretable:


3 Possible targets of RPE must be flanked by strong morpheme boundaries, which in German coincide with syllable boundaries (Höhle 1985). Booij (1985) observes that RPE targets therefore are possible 'phonological words' (or rather, strings of phonological words). Hence, he argues, RPE is a rule operating on 'prosodic structure' in the PF component, not a rule of syntax proper.

under identity with a corresponding string in the initial conjunct <sup>1</sup>B. The reason for not assuming FCR is simply that for a number of different types of phenomena, conditions of well-formedness and/or interpretation require (2), (5) and (24) jointly to be true. In particular, structures resulting from FCR – as opposed to RPE and Gapping structures – are syntactically well-formed only if they comply with the Conservation Condition (2), and their interpretations often do not accord to that of their unreduced sources. See, for example, Partee (1970), Partee & Rooth (1983), Lie (1982) and Neijt (1978; 1979; 1987; 1989) for ample demonstration.<sup>4</sup>

Part of the semantic evidence for (24) can be easily appreciated by comparing instances of RPE with putative instances of FCR.<sup>5</sup> Consider an example with a quantified NP such as *jedes Spielzeug* 'every toy':

(25) [Karl Karl zeigt shows den the Kindern children \_\_\_] oder or [Heinz Heinz zeigt shows den the Eltern parents jedes Spielzeug] every toy

This is synonymous with (26):

(26) [Karl zeigt den Kindern jedes Spielzeug] oder [Heinz zeigt den Eltern jedes Spielzeug]

'Karl shows every toy to the children, or Heinz shows every toy to the parents'

It does not mean 'for every toy, Karl shows it to the children or Heinz shows it to the parents'. Contrast this with (27):

(27) daß that jeder every Lehrer teacher [den the Kindern children ein a Buch book zeigt] shows oder or [den the Eltern parents einen a Film movie zeigt] shows

'that every teacher shows a book to the children or shows a movie to the parents'

<sup>4</sup>Actually, FCR comes in two varieties in the literature, viz., as a deletion process and as an extraction-and-adjunction process. As an extraction process it is necessarily string vacuous with respect to the first conjunct and it results in adjunction structures that cannot be defended independently. Both varieties either undergenerate or overgenerate massively if they are not (i) very severely restricted and (ii) complemented by phrasal conjunction. But when phrasal conjunction is given, there is no point in having FCR in the first place. If it still turns out that some phenomenon can only be analyzed as the result of a conjunct initial elision process, care must be taken that this process be very narrowly constrained, otherwise gross misgeneration will be unavoidable. See Neijt (1979: 58f.) for a brief discussion, and Dowty (1988) for a different view, as well as Wesche (1989) for a critical appraisal.

<sup>5</sup> Part of the syntactic evidence for (24) is presently being rediscovered in the context of categorial grammar research, as in Houtman (1987).

8 On reconstruction and coordination

This is not synonymous with what, according to FCR, would be its full form:

(28) daß [jeder Lehrer den Kindern ein Buch zeigt] oder [jeder Lehrer den Eltern einen Film zeigt]

'that every teacher shows a book to the children or every teacher shows a movie to the parents'

The difference between RPE structures such as (25) and putative FCR structures such as (27) is accounted for by assuming that (i) the interpretation of RPE structures proceeds from their unreduced form (which presumably is identical with S-structure), and (ii) that FCR does not exist, so that the interpretation of 'FCR structures' proceeds from an S-structure where the conjuncts and the coordinating particle are in the domain of the quantified NP *jeder Lehrer* 'every teacher'. Similar observations can be made for an indefinite NP such as *ein Buch* 'a book'. An instance of RPE such as (29) is synonymous with its unreduced form (30):


That is, the book shown to the children need not be identical with the book shown to the parents.<sup>6</sup> Contrast this with a putative FCR structure such as (31):

(31) daß that ein a Lehrer teacher [den the Kindern children ein a Buch book zeigt] shows und and [den the Eltern parents einen a Film film zeigt] shows

'that a teacher shows a book to the children and shows a movie to the parents'

(i) Karl Karl zeigt shows den the Kindern children ein a Buch, book und and Heinz Heinz zeigt shows es it den the Eltern parents 'Karl shows a book to the children, and Heinz shows it to the parents'

<sup>6</sup>Both the full form and the RPE structure can also be understood to involve only one book. But while this interpretation is completely natural with the RPE structure, it has a ring of pedantry and lack of cooperativeness about it with the unreduced structure. We may account for this in terms of a Gricean theory of cooperative communicative behaviour. If a speaker knows that only one book is involved and has no reason to hide this fact from the listener, pronominalization provides him with a natural way of expressing this unambiguously, as in (i):

Clearly, pragmatic principles of interpretation that depend on the form of an utterance proceed from surface structure.

This cannot be understood to involve two different teachers, one showing a book to the children and another showing a movie to the parents. But that would precisely be the preferred interpretation of its putative unreduced source (32):

(32) daß [ein Lehrer den Kindern ein Buch zeigt] und [ein Lehrer den Eltern einen Film zeigt]

'that a teacher shows a book to the children and a teacher shows a movie to the parents'

These facts are predicted by (24) but would be very difficult to account for under the assumption that FCR exists.

### **1.4 On** *θ***-theory**

Given that FCR does not exist, coordinate structures that involve an NP trace are problematic for some versions of *θ*-theory. Consider the definition of chains (33), the principle of *θ*-role assignment (34), and the *θ*-criterion (35) from Chomsky (1982: 333ff.) in relation to the data (36):

	- i. *α*<sup>1</sup> is an NP
	- ii. *α<sup>i</sup>* locally A-BINDS *αi*+1
	- iii. for *i >* 1,
		- a. *α<sup>i</sup>* is a non-pronominal empty category, or
		- b. *α<sup>i</sup>* is A-free
	- iv. C is maximal, i.e., is not a proper subsequence of a chain meeting (i-iii).

Given the structure *S*, there is a set K of chains, K = {C*<sup>i</sup> }*, where C*<sup>i</sup>* = (*α i* 1 , …, *α i ni* ), such that:


8 On reconstruction and coordination

	- b. John*<sup>i</sup>* [is loved *t* 1 *<sup>i</sup>* by Bill] and [is hated *t* 2 *<sup>i</sup>* by Mary]
	- c. John*<sup>i</sup>* [may love Bill] and [is loved *t<sup>i</sup>* by him]

In (36a) the argument *John*, which occupies the subject position, is a member of the chain C<sup>1</sup> = (*John*). The subject position is *θ*-marked (under predication) by the phrase *may love Bill* and it is *θ*-marked by the phrase *may hate Mary*. Hence, according to (34) two *θ*-roles are assigned to C<sup>1</sup> , and *John* has two *θ*roles, according to (35iii).

In (36b) *John* is a member of the chains C<sup>1</sup> = (*John*, *t* 1 ) and C<sup>2</sup> = (*John*, *t* 2 ). Both chains are maximal, according to (33iv). The position occupied by *t* 1 is *θ*-marked by *loved*, while the position occupied by *t* 2 is *θ*-marked by *hated*. Hence each chain has one *θ*-role assigned to it, and *John*, being a member of both chains, has two *θ*-roles.

In (36c) *John* is a member of the chain C<sup>1</sup> = (*John, t*). Since chains must be maximal, there is no other chain that *John* is a member of. The subject position occupied by *John* is *θ*-marked by *may love Bill*, and the object position occupied by *t* is *θ*-marked by *loved*. Hence, both the subject position and the object position assign a *θ*-role to C<sup>1</sup> , thus violating (35i).

We can see here that this version of the *θ*-theory induces an analogue of the CSC/ATB (6) for A-bound traces. The remarkable fact is that this analogue appears to be falsified by (36c). This, of course, is not particular to passive constructions, but is revealed by raising constructions just as well:

	- b. John*<sup>i</sup>* [may love Bill] and [is likely *t<sup>i</sup>* to marry him]

Here again, (37a) is sanctioned by (35), as there are two chains with *John* a member of both, whereas (37b) is incorrectly ruled out by (35), since there is a chain two members of which occupy a *θ*-marked position.

There are a number of possible answers to this problem (which do not necessarily exclude one another). One could try to modify (35i) appropriately or one could replace 'NP movement', whose existence has been controversial at least since Shopen (1972), by rules operating on lexical entries. One could also question the assumption, presupposed in (36) and (37), that a subject phrase may originate in a position external to the VP. If it instead originates in a position contained in a projection of the verb (as a daughter of Vmax), as argued by Fukui (1986), Kitagawa (1986) and others, then (36a,c) and (37b) have to be replaced by (38):

	- b. John*<sup>i</sup>* [may *t* 1 *i* love Bill] and [is (*t* 2 *i* ) loved *t* 2 *<sup>i</sup>* by him]
	- c. John*<sup>i</sup>* [may *t* 1 *i* love Bill] and [is likely (*t* 2 *i* ) to *t* 2 *<sup>i</sup>* marry him]

Here *John* in each case is a member of two different chains and has two *θ*-roles, sanctioned by the *θ*-criterion.

One may also question two other assumptions. In (34) it is presupposed that a position can be *θ*-marked without being case-marked and furthermore, that a subject argument may get its *θ*-role by two different mechanisms, viz., by predication or by transmission mediated by NP trace. Suppose instead that a position can only be *θ*-marked if it is case-marked.<sup>7</sup> Then the position of an NP trace, not being case-marked, cannot be *θ*-marked. The unassigned *θ*-role will then have to be assigned in the way that external *θ*-roles standardly are assigned, namely, to a position external to the constituent that immediately dominates the *θ*-role assigner. Cf. Williams (1984; 1987) where a very similar set of assumptions is argued for. Under these assumptions the position occupied by *John* in (36) and (37) is the only position involved in the relevant chains that is *θ*-marked, and (35i) is always (trivially) met.<sup>8</sup>

### **2 German clause structure**

Traditionally declarative sentences in German are hypothesized to conform to the (simplified) topological scheme (39):

(39) K – FIN – X – VK – Y

where K is one constituent, FIN the position of the finite verb, X a string of (possibly null) constituents and VK a string of (possibly null) verbs. For the most part

(i) daß that keiner*<sup>i</sup>* no [den the Hund dog streichelt] caresses und and [*e<sup>i</sup>* gebissen bitten wird] becomes 'that no-one caresses the dog and is bitten'

<sup>7</sup> If this condition is to apply in full generality without any modification, the position of PRO must be case-marked. Otherwise, PRO must be treated as an exception, just as it is in (34). <sup>8</sup>These assumptions would seem to be necessary, in fact, if it is true that the subject *keiner* 'noone' in (i) is in its base position, as it appears to be:

Note that under these assumptions the S-structure position of the subject in English is a *θ*position, and hence an A-position, even if the subject argument originates as a daughter of V max, as in (38), because none of the trace positions in (38) could be *θ*-marked. See Höhle (1990) for an analysis of asymmetric coordination in terms of these assumptions.

### 8 On reconstruction and coordination

we will disregard Y, which is a field reserved for extraposed elements. Examples such as (40) accordingly get the topological analysis (41):

	- b. den the Kindern children wird will Karl Karl ein a Buch book zeigen show 'Karl will show a book to the children'
	- b. den Kindern K – – wird FIN – – Karl ein X Buch – – zeigen VK

This topological theory tells us next to nothing about the hierarchical structure of sentences, but the theory of coordination outlined in Section 1, if correct, provides us with a means to inquire into constituent structure. Consider an example such as (42):

(42) den the Kindern children zeigt shows [weder neither [Karl Karl ein a Buch] book noch nor [Heinz Heinz einen a Film]] movie 'neither does Karl show a book to the children nor does Heinz show a movie to them'

Here, we can see that *Karl ein Buch* is an unreduced constituent: gapping cannot have been applied since the correlative coordinating particle *weder* 'neither' marks the beginning of the first conjunct and the finite verb *zeigt* 'shows' is outside that conjunct. But that conjunct would be an impossible kind of constituent if it would consist merely of *Karl* and *ein Buch*: neither of them stands in any grammatical relation to the other, but both may be said to stand in a grammatical relation to *zeigt*. (Analogously for the second conjunct *Heinz einen Film*.) Such a violation of strict compositionality would be inconceivable. We must suppose, therefore, that each conjunct contains a phonologically empty verb in relation to which *Karl* functions as subject and *ein Buch* functions as object. Since verbs are situated in VK (as long as they are not in FIN or in K), we arrive at the conclusion that (40a) has the structure (43):

(43) den Kindern K – – zeigt FIN – – [Karl [ ein X Buch – – [<sup>V</sup> *e*] VK ] ]

The empty verb obviously must be related to the verb in FIN. I will assume here that FIN is a Ā-position and that the empty verb is a trace bound by the verb in FIN.

In this way, coordination gives us a very simple argument that so-called verbsecond clauses (and by analogous arguments 'verb-first' clauses) are properly speaking verb-final in S-structure, in that (i) FIN is not a verbal position proper but a position to be occupied by something bearing finite inflection, and (ii) the true verbal position is clause-final. It is realized by a verbal trace if the verb bearing finite inflection is attracted to the FIN position.<sup>9</sup> Furthermore, the theory of coordination – specifically hypothesis (24) – enforces the assumption that "FIN – X – VK" is a constituent. Consider an example such as (44):

(44) den the Kindern children [[zeigt shows Karl Karl ein a Buch] book oder or [zeigt shows Heinz Heinz einen a Film]] movie 'Karl shows a book to the children, or Heinz shows a movie to them'

Since FCR does not exist, *zeigt Karl ein Buch* must be an unreduced constituent (analogously for *zeigt Heinz einen Film*).

The K-position can be occupied by a constituent of virtually any type with any of a number of different functions. In (45a), for example, it is occupied by a direct object; in (45b) by an indirect object; in (45c) by a subject; in (45d) by a nonfinite verb. In (45e) it is occupied by the pronominal *da* 'there' that originates in a 'pronominal PP' *davon* 'there-of, of that,' the preposition *von* 'of' being stranded in the X-field:


the Karl should the cat feed 'Karl should feed the cat'

<sup>9</sup>The theory of a clause-final verbal trace originated in the 20's of the 19th century in the work of the same authors who developed the first systematic theory of coordination and subordination (embedding). See Höhle (1986) for historical remarks.

### 8 On reconstruction and coordination

(cf. (14a))

d. gesungen sung – hat has Karl Karl häufig often 'Karl often sang'

e. da there – hat has sie she dir you schon already von of erzählt told 'she already told you about that'

Moreover, in varieties of German that make use of 'long extractions' the Kposition serves as a landing site for long extracted expressions of just the same types:

	- b. den the Kindern children – hoffen hope wir, we daß that Karl Karl ein a Buch book zeigt shows 'we hope that Karl shows a book to the children'
	- c. der the Karl Karl – denke think ich, I daß that den the Kater cat füttern feed sollte should 'I think that Karl should feed the cat'
	- d. gesungen sung – fürchte fear ich, I daß that Karl Karl häufig often hat has 'I am afraid that Karl often sang'
	- e. da there – behauptet claims Karl, Karl daß that sie she dir you schon already von of erzählt told hat has 'Karl claims that she already told you about that'

(In these examples the embedded clauses introduced by *daß* 'that' are situated in the Y-field of their matrix clauses.) From (45) and (46) we must conclude that the K-position is a Ā-position and that the constituent which occupies the Kposition Ā-binds a trace in its original position. In (45b), for example, the indirect object *den Kindern* '(to) the children' that occupies the K-position certainly is a dislocated constituent, its normal position being in the X-field after the subject. So, we have to assume that there is a trace in X that is Ā-bound by *den Kindern*, as in (47):

(47) [den Kindern]*<sup>i</sup>* K [zeigt*<sup>j</sup>* [ FIN [Karl [ *ti* X ein Buch – – *tj* VK ]] ]]

Embedded clauses typically (but not invariably) are 'verb-final'; they conform to the (simplified) topological scheme (48):

$$\text{(48)}\quad \text{CMP}-\text{X}-\text{VK}-\text{Y}$$

where the CMP-field in Standard German is very similar to what used to be called the 'COMP-position' in English (except that in finite clauses CMP cannot be empty), and where X, Y and VK are characterized exactly as in (39). Of course, VK cannot in general be empty here, since there is no other position in the clause that a finite verb could move to. Here again coordination data such as (49) lead to the conclusion that "X – VK" is a constituent:

	- b. welchen which Vorschlag proposal [[viele many unterstützen] support und and [kaum hardly einer one ablehnt]] rejects (cf. (7b))

Clearly there is a phrasal Ā-position (exactly one such position) in the CMP-field that serves as a landing site for (short or long) extractions, (49b) being an instance of short extraction of a direct object. The structure of a simple (non-coordinate) example of this type is accordingly as shown in (50):


Summarizing these observations (and ignoring the Y-field), 'verb-second' clauses are structured as in (51a) and 'verb-final' clauses are structured as in (51b):

(51) a. [*<sup>α</sup>* K [*<sup>β</sup>* FIN [*<sup>γ</sup>* X VK]]] b. [*<sup>δ</sup>* CMP [*<sup>ε</sup>* X VK]]

As to the category types, we certainly may identify *δ* with S*′* , where presumably S *′* = Cmax. It is plausible to assume that *ε* = *γ* = S, but it is not obvious whether S = I max or S = Vmax with the subject position a daughter of Vmax. We may naturally assume that *β* and *α* are projections of FIN, but again it is not obvious whether FIN = C<sup>0</sup> (so that *β* = C<sup>1</sup> and *α* = Cmax = *δ*) or rather FIN = I<sup>0</sup> , in any of the current conceptions of I (so that *β* = I<sup>1</sup> and *α* = Imax, but certainly *α ̸*= *γ*), or even FIN =

8 On reconstruction and coordination

CONFL<sup>0</sup> , i.e., the unification of I<sup>0</sup> and C<sup>0</sup> . <sup>10</sup> FIN is a Ā-position such that a verb in FIN binds a trace in the VK-field of its own clause. K is a Ā-position, and there is a phrasal Ā-position in the CMP-field. They both serve as landing sites for (short or) long extractions such that the extracted expression binds a trace in some S (= *γ* = *ε*).<sup>11</sup>

### **3 On Ā-binders**

We will now have a look at constituents occupying a Ā-position, specifically, the K-position and the FIN-position of German declaratives. We will see that some of them behave as if they occupied the position of the trace they bind.

<sup>11</sup>There are also Ā-positions in the X-field, such as the positions of *da* (extracted from a PP whose remnant is *von*, cf. (45e) and (46e)) in (i):

	- b. ob whether CMP – – mein my Kollege colleague da there schon already X jemand someone von of – – erzählt told VK hat has 'whether my colleague told someone about that already'

However, Ā-positions in X, as opposed to the Ā-position in CMP and to K, do not serve as landing sites for long extractions; i.e., they conform to the properties that are characteristic of 'clitic-movement' (cf. Aoun 1985).

It appears that reflexives and weak pronouns may also undergo clitic-movement. Just like A-binders, they are not subject to the CSC/ATB, even though they Ā-bind a trace:

(ii) a. wenn if Karl Karl sich*<sup>i</sup>* -self weder neither [*t<sup>i</sup>* um about die the Kinder children kümmert] worries noch nor [seine his Arbeit work erledigt] executes

'if Karl neither sees to the children nor does his work'

b. daß that mich*<sup>i</sup>* me jeder every [*t<sup>i</sup>* nur only anstarrt] stares-at und and [mir me nicht not hilft] helps 'that everyone only stares at me and does not help me'

<sup>10</sup>If FIN = I<sup>0</sup> , (51b) should perhaps be replaced by (i), with I<sup>0</sup> empty, as suggested by Kathol (1989) (cf. Höhle 1990):

<sup>(</sup>i) [*<sup>δ</sup>* CMP [<sup>I</sup> max I 0 [*<sup>ε</sup>* X VK]]]

### **3.1 Scope**

### **3.1.1 True quantifiers**

Consider an example with a quantified NP in the K-position such as (52), read with normal (falling) declarative intonation:

(52) alle all Politiker politicians haben have nicht not zugehört listened

It means: 'For all politicians x, x did not listen'; i.e., the negator *nicht* 'not' is in the scope of the quantified NP *alle Politiker* 'all politicians'. This is just as we would expect, given that in German scope relations are typically determined by the s-command relations<sup>12</sup> at S-structure. See Jacobs (1982; 1983) and Pafel (1988) for ample demonstration and discussion.<sup>13</sup>

The scope relations are reversed, however, under 'I-Topic intonation', i.e., when a special bipartite intonation pattern is used such that there is rising intonation on a first stressed constituent (indicated by "/") and falling intonation on a second stressed constituent (indicated by " \ "), as in (53):<sup>14</sup>

### (53) ALLE / Politiker haben NICHT \ zugehört

This means: 'It is not the case that all politicians listened'; i.e., *alle Politiker* is in the scope of the negator. This reversal of scope cannot be accounted for by assuming that with I-Topic intonation *nicht* is raised at LF so that it s-commands the K-position. Compare (54a) and (54b):

<sup>12</sup>In a tree T, *α* s-commands *β* if and only if *β* is contained in a sister of *α*. The only difference between s-command and c-command (under its most usual definition, where it is the converse of 'in construction with' (Klima 1964: 294)) resides in the 'first branching node' condition that is built into c-command. That condition has never been argued for, and in those few cases where it has a chance to apply nontrivially, it appears to have unfelicitous consequences.

<sup>13</sup>It is often argued that examples such as (i) falsify the claim that in the unmarked case scope is determined by s-command at S-structure, in that (i) has a reading with *someone* outside the scope of *everyone*:

<sup>(</sup>i) everyone loves someone

While the observation is correct, it does not show that there is an ambiguity of scope. What is at stake here, rather, is the specific reading versus the non-specific reading of the indefinite NP, and the specific reading cannot be adequately represented by the mechanisms of quantifier scope. See Kasher & Gabbay (1976) and Fodor & Sag (1982) for discussion.

<sup>14</sup>Jacobs (1982) introduced the term 'I-Topikalisierung' for the intonation pattern under discussion, where "I" is short for 'intonation'.

8 On reconstruction and coordination

(54) a. ALLE \ all Politiker politicians hat has so such mancher some nicht not verstanden understood 'for all politicians x, there are several people y such that it is not the case that y understood x' (*∀*x *∃*y NEG) b. ALLE / Politiker hat so mancher NICHT \ verstanden

'there are several people y such that it is not the case that, for all politicians x, y understood x' (*∃*y NEG *∀*x)

In (54a) as well as in (54b) the indefinite *so mancher* 'several people' is outside the scope of *nicht* 'not'. In (54a) *alle Politiker* has widest scope (over *so mancher* and over *nicht*); in (54b) it has narrowest scope (*so mancher* and *nicht* are outside its scope). If *nicht* were raised, we would get the reading 'it is not the case that, for all politicians x, there are several people y such that y understood x' (NEG *∀*x *∃*y). But this is not the reading of (54b); rather, (54b) is synonymous with (55):

(55) es hat so mancher nicht alle Politiker verstanden

'several people did not understand all politicians' (*∃*y NEG *∀*x)

It is not true, then, that the scope reversal that we observe with I-Topic intonation is a result of LF raising.

Neither is I-Topic intonation by itself able to induce scope reversal. Consider (56), where the quantified NP bearing rising intonation is not in the K-position but in the X-field:

(56) trotzdem still haben have ALLE / all Politiker politicians NICHT \ not zugehört listened 'it is still the case that, for all politicians x, x did not listen'

To the extent that (56) is acceptable at all, only the normal scope relations in accordance with s-command are available. Although the intonation and the linear precedence relations are the same in (56) and (53), no reversed scope interpretation is available.

There is, of course, one obvious difference between (53) and (56): in (53) *alle Politiker* Ā-binds a trace in the X-field, whereas there is no reason to assume that it does in (56). Hence I will assume that (57) is true:

(57) With I-Topic intonation a quantified expression E1 that bears rising intonation is in the scope of exactly those expressions E2 that have scope over a trace *t* that is Ā-bound by E1 (for E2 *̸*= E1).

We may naturally assume that (53) has the structure (58a) and that (54b) has the structure (58b):

(58) a. [ALLE Politiker]*<sup>i</sup>* [haben [NICHT *t<sup>i</sup>* zugehört]] b. [ALLE Politiker]*<sup>i</sup>* [hat [so mancher [NICHT *t<sup>i</sup>* verstanden]]]

In both cases *t<sup>i</sup>* is s-commanded by, and in the scope of, *nicht*; hence the Ā-binder *alle Politiker* is in the scope of *nicht* too.

There might also be another possible analysis. Suppose that scope can be extended upwards so that the primary s-command domain is properly included in the extended scope domain, as long as the extension does not include any expression that is sensitive to scope. For example, the extended scope domain of *nicht* in (59) will include the definite NPs *du* 'you' and *den Hund* 'the dog', although they are not s-commanded by *nicht*: 15

(59) vielleicht perhaps hast have du you den the Hund dog nicht not gehört heard 'perhaps you did not hear the dog'

Assume furthermore that a Ā-bound trace behaves like a definite NP in that it can lie in an extended scope domain. Cf. Basri & Finer (1987), who argue on morphological grounds for the definiteness of trace. Under this assumption (58) may be replaced by (60):

(60) a. [ALLE Politiker]*<sup>i</sup>* [haben [*t<sup>i</sup>* [NICHT zugehört]]] b. [ALLE Politiker]*<sup>i</sup>* [hat [so mancher [*t<sup>i</sup>* [NICHT verstanden]]]]


<sup>15</sup>It is a remarkable fact that indefinite non-specific NPs can lie in an extended scope domain, as in (iB), although they are evidently sensitive to scope, provided they are contextually 'given' (explicitly or by implicature):

8 On reconstruction and coordination

Now the trace *t<sup>i</sup>* can be considered to be in the (extended) scope of *nicht*, hence, by (57), *alle Politiker* is in the scope of *nicht*.

There is evidence that some mechanism like this must indeed be available in German. Jacobs (1980) exemplified and discussed in detail examples such as (61):

	- b. BEIDEN / both Ärzten doctors sollte should Luise Luise KEINE \ no Spieldose musical box vermachen will 'Luise should not will a musical box to both doctors' (NEG 2x *∃*y)

Here the phrases *alle Lehrer* 'all teachers' and *beide Ärzte* 'both doctors' are understood to be in the scope of negation. Yet, this cannot be accounted for by giving maximal scope to the negatively quantified phrases *kein Buch* 'no book' and *keine Spieldose* 'no musical box'. This would give us the readings 'there is no book that all teachers recommended to me' (NEG *∃*y *∀*x) and 'there is no musical box that Luise should will to both doctors' (NEG *∃*y 2x), and these readings are unavailable for (61). At the same time the reading that (61) has is not available in (62) (with or without I-Topic intonation):

(62) a. mir haben alle Lehrer kein Buch empfohlen

'for all teachers x, x did not recommend a book to me' (*∀*x NEG *∃*y)

b. Luise sollte beiden Arzten keine Spieldose vermachen 'for both doctors x, Luise should not will a musical box to x' (2x NEG *∃*y)

Hence it appears necessary to assume that in (61) the negation contained in the negatively quantified NP extends its scope over a trace to its left:

	- b. [BEIDEN Ärzten]*<sup>i</sup>* [hat [Luise [*t<sup>i</sup>* [KEINE Spieldose vermacht]]]]

There is also some doubt whether the structures given in (58) can be adequate for (53) and (54b). Pafel (1989) observed that examples such as (64) are bad although their presumed 'sources' (65) are unobjectionable:

	- b. ⁇ ALLE / all haben have NICHT \ not einen a Hund dog gesehen seen
	- b. trotzdem haben nicht alle einen Hund gesehen 'still, not everyone saw a dog'

This is difficult to understand if (58) is correct. But it can be accounted for if we make two assumptions. First, the focal NP of a focus sensitive logical element (such as negation and scalar particles) can never be extracted out of this element's s-command domain; hence (64) cannot 'derive' from structures such as (65), but only from structures such as (66):

	- b. trotzdem haben alle nicht einen Hund gesehen

Second, the placement of *nicht* before the objects as in (66) is felicitous only if its s-command domain contains a focal NP. This condition is not observed in (64). I assume, therefore, that the structures (60) and (63) are the only correct ones.

### **3.1.2 Indefinites and clauses**

Consider an example with an indefinite NP in the K-position such as (67), read with normal declarative intonation:

	- a politician has not listened

This has a reading where the NP is in the scope of the negation *nicht*: 'It is not the case that a politician listened'. Similarly for (68):

	- a politician have many people adored

Here the indefinite NP *einen Politiker* 'a politician' can be understood to be referentially dependent on (i.e., in the scope of) *viele Leute* 'many people': 'there were many people who adored a politician'. The S-structures of (67) and (68) can be assumed to be as shown in (69):

8 On reconstruction and coordination

(69) a. [ein Politiker]*<sup>i</sup>* [hat [*t<sup>i</sup>* [nicht zugehört]]]

b. [einen Politiker]*<sup>i</sup>* [haben [viele Leute [*t<sup>i</sup>* verehrt]]]

In these readings, then, the scope relations that the phrase in the K-position enters into are determined by the position of the trace that it Ā-binds.

Indefinite NPs, however, differ significantly from quantified NPs with regard to the role played by intonation. The scope relations of truly quantified NPs seem to be unambiguous. With normal intonation they are strictly determined by their S-structure position, as in (52) and (54a). With I-Topic intonation they are determined by the position of their trace, as in (53), (54b) and (61). But the scope relations of indefinite NPs are ambiguous with normal intonation: there is one scope reading determined by the position of their trace, as in (67) and (68); and there is another scope reading determined by their S-structure position, such that they are outside the scope of any element s-commanded by them.<sup>16</sup>

Sometimes it is not obvious a priori whether a given NP should be expected to behave like a quantified NP as in (52) or rather like an indefinite NP as in (68). Consider (70), read with normal declarative intonation:

(70) viele many Politiker politicians haben have die the meisten most nicht not verstanden understood

This has a reading with *viele Politiker* 'many politicians' in the scope of *die meisten* 'most people' and outside the scope of the negation: 'For most people x there are many politicians y such that x did not understand y' (MOSTx MANYy NEG). Hence, the scope relations are determined according to the position of the trace:


This has a reading with *vielen Politikern* in the scope of *auch Karl* 'even Karl' and the negation: 'Even Karl did not meet many politicians'. Here we may assume that the trace is in the extended scope of *nicht*:

(73) [vielen Politikern]*<sup>i</sup>* [ist [auch KARL [*t<sup>i</sup>* nicht begegnet]]]

<sup>16</sup>This seems to be a genuine ambiguity of scope, independent of the specific/non-specific ambiguity. See Pafel (1988) for arguments to this effect.

Ordinarily NPs of the form "*viele (N)*" 'many (N)' are thought to be truly quantified, but here we can see that they behave like indefinites.<sup>17</sup> This observation is corroborated by left dislocation structures. Definite NPs as well as indefinite NPs can participate in such constructions, whereas truly quantified NPs are strictly excluded:<sup>18</sup>

	- b. einen a Porsche, Porsche den the hat has sie she früher earlier mal once besessen owned 'earlier, she owned a Porsche'
	- c. wilden wild Tieren, animals denen the gehe go ich I aus out dem the Weg way 'I avoid wild beasts'
	- b. \* kein Vorschlag/keinen Vorschlag, den verstehe ich 'I do not understand any proposal'
	- c. \* fast alle Leute, die mußte ich nach Hause schicken 'I had to send away almost all people'

But *viele (N)* does occur in left dislocation:

	- 'there are many proposals that I do not understand'
	- b. viele Leute, die mußte ich wegschicken

'there are many people that I had to send away'

c. viele Lehrer/vielen Lehrern, denen gehe ich lieber aus dem Weg 'there are many teachers that I rather avoid'

<sup>17</sup>This has been independently observed by Pafel (1989). Example (70) is adapted from him. <sup>18</sup>This fact is important for the general theory of scope reversal. According to Kiss (1987) scope reversal in Hungarian is dependent upon an intonation pattern that seems to be very similar to I-Topic intonation in German. She argues that in Hungarian this is an instance of left dislocation, implicating that this assumption may somehow contribute to an explanation of scope reversal. But while it is true that left dislocation shows various 'connectedness phenomena', scope reversal with quantified NPs as in (53) and (54b) cannot be an instance of left dislocation

in German, given that quantified NPs are not allowed in left dislocation structures.

### 8 On reconstruction and coordination

Hence, *viele (N)* cannot be considered to be necessarily quantificational in the way that *jed-/kein-/alle (N)* 'every/no/all (N)' are. In those cases where *viele (N)* does show distributive effects, as in (68), this may be caused by the plural, just as plural definites can be distributive:

(77) die Leute benutzten ein Stäbchen zum Essen

'the people used a chopstick for eating'

A similar question arises with regard to clauses in the K-position. The preposed clause in (78) contains the negative polarity item *jemals* 'ever' that is bound to be in the scope of the negation:

	- b. [daß du jemals so etwas tun könntest]*<sup>i</sup>* [hat [manch einer [*t<sup>i</sup>* nicht geglaubt]]]

Although there does not seem to be any a priori reason to expect this, complement clauses seem to behave like indefinite NPs in that they may enter into scope relations according to the position of the trace bound by them, without the help of I-Topic-intonation.

### **3.1.3 Verbs**

It has often been observed that finite verbs in the FIN-position behave exceptionally with regard to scope. When the finite verb is in VK, as in (79), scope is assigned in accordance with the usual s-command condition:

(79) daß that Karl Karl irgendjemand someone kein no Buch book zeigen show möchte wants 'that there is a person x such that Karl does not want to show a book to x'

The indefinite *irgendjemand* 'someone' is outside the scope of the negatively quantified NP *kein Buch* 'no book', and in the reading considered here, *möchte* 'wants' is in the scope of the negation. Remarkably, in a corresponding clause with the finite verb in FIN, exactly the same scope relations are found:

(80) Karl möchte irgendjemand kein Buch zeigen

That is, *kein Buch* still has scope over *möchte* but does not have scope over *irgendjemand*. This is less surprising, though, than it seems to be, since we know (i) that the verb in FIN Ā-binds a trace in VK, and (ii) that scope relations may be determined by the position of such a trace:

(81) Karl [möchte*<sup>i</sup>* [irgendjemand kein Buch zeigen *ti*]]

This effect is independent of intonation.<sup>19</sup>

One might entertain the assumption (i) that the scope relations of the verb are determined at D-structure, not S-structure; or (ii) that movement of the verb to the FIN-position is a PF phenomenon. However, there is rather direct evidence from Verum focus ('polarity focus') that both assumptions are incorrect. Under appropriate contextual conditions, stress on the finite verb in the FIN-position, as in (82), can be understood to emphasize that the assertion is true:

(82) er he HÖRT hears mir me zu to 'he does listen to me'

This effect is absent when the finite verb is in VK, as in (83):

	- b. du siehst doch, daß er mir ZUhört

In (83a), *zuHÖRT* 'listens' may be in contrast to *zuSTIMMT* 'agrees'; in (83b), *ZUhört* may be in contrast to *WEGläuft* 'runs away'. But neither of them can have an effect even remotely similar to (82). I assume, therefore, that the FINposition is associated with a meaning component symbolized by "VERUM". By stressing phonetic material (i.e., the verb) in FIN that component can be emphasized. Importantly, the Verum component can be in the scope of a negation to its right. In a context such as (84a) an utterance of (84b) can have the effect of an emphatic denial of the truth of (84c):

(84) a. wir hoffen, daß dir alle zuhören

'we hope that everyone listens to you'

(i) Karl Karl füttert feeds den the Hund dog nicht not

<sup>19</sup>It would be natural, therefore, to assume that this effect is optional, and so it seems indeed to be in certain cases. In general, however, it appears to be obligatory. An example such as (i) apparently cannot have the meaning of (ii), but must be understood as in (iii):

<sup>(</sup>ii) There is a relation of feeding such that it does not hold between Karl and the dog.

<sup>(</sup>iii) There is no relation of feeding such that it holds between Karl and the dog.

8 On reconstruction and coordination


As VERUM is associated with FIN and FIN is not s-commanded by *keiner* 'noone', we must assume that VERUM is in the scope of negation by virtue of the fact that the verb in FIN Ā-binds a trace that is s-commanded by negation. Cf. Höhle (1988).

We may extend these observations by considering verb projections in the Kposition. In (85) the indefinite *einen Hund* 'a dog' is referentially dependent on *viele Kinder* 'many children':

(85) einen a Hund dog gefüttert fed haben have viele many Kinder children 'many children fed a dog'

Similar observations hold with regard to negation. In (86) the negative polarity item *jemals* 'ever' must be in the scope of the negatively quantified phrase *keiner von euch* 'none of you':

(86) jemals ever gearbeitet worked hat has wohl presumably keiner no von of euch you 'presumably none of you has ever worked'

The structures shown in (87) allow these observations to be accounted for by the assumption that the verb projections are in the scope of those expressions that s-command their trace:

(87) a. [einen Hund gefüttert]*<sup>i</sup>* [haben [viele Kinder *ti*]] b. [jemals gearbeitet]*<sup>i</sup>* [hat [wohl keiner von euch *ti*]]

### **3.2 A-binding**

The observations that we have made with regard to scope assignment are paralleled by observations concerning A-binding. In order to appreciate the data to follow it is important to recognize that 'binding' – specifically A-binding – as used here is an undefined notion the elucidation of which is a topic of current research. By its very nature binding is an irreflexive asymmetric relation, and it is an open question whether it should be construed as being transitive. Although the device of coindexing, a symmetric and transitive relation by definition, is a truly misleading means of representing binding relations, I will use it in the conventional way.

### **3.2.1 Overt anaphoric expressions**

Consider an example with a verb projection in the K-position containing a reflexive:

	- b. [sich*<sup>i</sup>* rasieren]*<sup>j</sup>* [sollte*<sup>k</sup>* [sie*<sup>i</sup>* [t*<sup>j</sup>* t*k*]]]

The reflexive *sich* '-self' (3rd person, no gender or number distinctions) is understood as being A-bound by *sie* 'she', although it is not s-commanded by its antecedent. The usual formulations of the binding theory, relying strictly on scommand, cannot account for a case like (88) at S-structure. We note, however, that *sich* is bound by an antecedent that s-commands the trace that is Ā-bound by *sich rasieren*, as shown in (88b).

In (89a) the reflexive *sich* in the K-position (to which the emphatic particle *selbst* 'self' may be added) is A-bound by an antecedent that s-commands the trace that is Ā-bound by the reflexive:

(89) a. sich -self (selbst) (self) sollte should sie she rasieren shave

'she should shave herself'

b. [sich (selbst)]*<sup>i</sup>* [sollte [sie*<sup>i</sup>* [*t<sup>i</sup>* rasieren]]]

Note that this configuration is different from a strong crossover configuration (which will be discussed in Section 6.1). The reflexive must be bound, and *sie* is the only possible antecedent. From the asymmetry of binding it follows that *sie* cannot be bound by *sich*, hence there is no chance for a strong crossover effect to ensue.

In (90) and (91) we observe A-bound possessives:

	- b. [seinen*<sup>i</sup>* Hund gefüttert]*<sup>j</sup>* [hat*<sup>k</sup>* [wohl keiner*<sup>i</sup>* [*t<sup>j</sup> tk*]]]
	- b. [seinen*<sup>i</sup>* Hund]*<sup>j</sup>* [hat [wohl keiner*<sup>i</sup>* [*t<sup>j</sup>* gefüttert]]]

Under the relevant reading the possessive *seinen* 'his' is A-bound by *keiner* 'noone', which s-commands the trace of the phrase that contains the possessive.

### 8 On reconstruction and coordination

The same configuration is found in complement clauses:

	- b. [zugeben, daß er*<sup>i</sup>* krank ist]*<sup>j</sup>* [würde*<sup>k</sup>* [wohl keiner*<sup>i</sup>* [*t<sup>j</sup> tk*]]]
	- b. [daß er*<sup>i</sup>* krank ist]*<sup>j</sup>* [würde [wohl keiner*<sup>i</sup>* [*t<sup>j</sup>* zugeben]]]

Under the relevant reading *er* 'he' is A-bound by *keiner*, which again s-commands the trace of the phrase that contains the bound pronoun.

### **3.2.2 Pronominal coreference**

Let us try to replace the binding relations seen in (88)–(93) by coreference:

	- b. [den Kerl dort drüben]*<sup>i</sup>* sollte er*<sup>j</sup>* rasieren 'the guy over there, he should shave'
	- b. den Hund von [dem Kerl dort drüben]*<sup>i</sup>* hat er*<sup>j</sup>* selten gefüttert 'the dog of the guy over there he seldom fed'

The examples are perfectly grammatical, and since pronouns usually pick up a referent introduced earlier in the text, we would expect that the pronoun *er* 'he' may be understood as being coreferential with the definite NP *d- Kerl dort drüben* 'the guy over there' to its left. But this reading is as difficult to get here as it is in (97):

	- b. trotzdem hat er*<sup>j</sup>* den Hund von [dem Kerl dort drüben]*<sup>i</sup>* gefüttert
	- c. trotzdem würde er*<sup>j</sup>* kaum zugeben, daß [der Kerl dort drüben]*<sup>i</sup>* krank ist

In (97) well-known restrictions against coreference make a disjoint reference reading nearly obligatory (i.e., *i ̸*= *j*). Obviously the same is true of (94)–(96). It appears, then, that with verb projections and definite NPs in the K-position coreference relations are obligatorily computed with respect to the trace that is Ā-bound by them.

With clauses the situation is slightly different. While (93) shows that binding in accordance with the position of the trace is possible, coreference is not excluded in the same configuration:

(98) (?) daß [der Kerl dort drüben]*<sup>i</sup>* krank ist, würde er*<sup>i</sup>* kaum zugeben 'that the guy over there is ill, he would hardly admit'

While judgements vary somewhat, there is no doubt that a coreference reading is far more accessible here than in examples like (96).

### **3.2.3 Empty categories**

Given that A-binding of non-empty anaphoric expressions may involve the position of a Ā-bound trace, we may expect empty categories to behave similarly.

There is in fact evidence in English that traces of 'NP-movement' (passive and subject-to-subject raising) may be bound by an antecedent they are not s-commanded by, as long as they are lexically governed (data from Thiersch (1985) and personal communication):

	- b. [likely *t<sup>i</sup>* to succeed]*<sup>j</sup>* though John*<sup>i</sup>* may be *t<sup>j</sup>*
	- c. [likely *t<sup>i</sup>* to be fired *t ′ <sup>i</sup>*]*<sup>j</sup>* John*<sup>i</sup>* certainly is *t<sup>j</sup>*

In each case *t<sup>i</sup>* is A-bound by *John*. This is possible because *John* s-commands *tj* , which is Ā-bound by the phrase containing *t<sup>i</sup>* . <sup>20</sup> Equivalent examples can be found in Italian:<sup>21</sup>

	- b. \*[how likely *t<sup>i</sup>* to be taken *t<sup>i</sup>* of John]*<sup>j</sup>* is advantage*<sup>i</sup> t<sup>j</sup>*

This seems also to be true of pure passive structures:

	- b. \*[kept *t<sup>i</sup>* on John]*<sup>j</sup>* though tabs*<sup>i</sup>* will be *t<sup>j</sup>*

It appears, then, that the preposed phrase must be a predicative category (assign an external *θ*-role), for reasons unknown.

<sup>20</sup>However, M. Baltin (cited by Saito (1989: 199)) observed that in raising structures the binder cannot be a non-argument:

<sup>21</sup>In this paper, Italian data are taken from Longobardi (1985).

8 On reconstruction and coordination

(100) [tradito *t<sup>i</sup>* da sua moglie]*<sup>j</sup>* [credo che Mario*<sup>i</sup>* non sia mai stato t*j*] 'betrayed by his wife, I believe that Mario has never been'

Traces of clitic-movement behave just the same:

(101) [offerte *t<sup>i</sup>* a sua moglie]*<sup>j</sup>* [credo che Mario ancora non le*<sup>i</sup>* abbia t*j*] 'offered *t<sup>i</sup>* to his wife, I believe that Mario them*<sup>i</sup>* has not yet'

Although such traces are Ā-bound by their antecedent (*t<sup>i</sup>* is Ā-bound by *le*), they are known to comply with the conditions on A-bound traces (Aoun 1985). Therefore (101) does not come as a surprise, given that (100) is possible.

In German there is at least one obvious candidate for 'clitic-movement', viz., structures such as (102a) related to (102b):

	- b. er hat oft davon gesprochen

Cf. note 11. Whereas *davon* 'there-of' can be contained in a phrase in the K-position (103), the trace of *da* cannot (104):


I assume that the trace *t* in (102a) is not lexically governed but antecedent-governed. If this is correct, we may assume that *t<sup>j</sup>* in (104) fails to be antecedentgoverned (whereas *t<sup>i</sup>* in (101) is lexically governed). This would mean, then, that for antecedent-government to be possible, binding must be determined by s-command at S-structure.

Italian allows extraction much more freely than English. It thereby offers an opportunity to observe the behaviour of Ā-bound traces. As it turns out, traces of *wh*-movement (105) and topicalization (106) must be s-commanded by their antecedent at S-structure:<sup>22</sup>

<sup>22</sup>In this respect so-called scrambling in Japanese (at least, non-local scrambling) behaves like *wh*movement and topicalization in Italian; see Saito (1989: 190). Note that scrambling in Japanese (as opposed to 'scrambling' in German) also behaves as *wh*-movement does in some variants of English with respect to A-binding, discussed in Section 6.3; see references in note 31.

(105) \* [a sposare *ti*]*<sup>j</sup>* [non so proprio [[quale ragazza]*<sup>i</sup>* [Gianni sarebbe disposto *tj*]]]

> 'to marry *t<sup>i</sup>* , I really do not know [which girl]*<sup>i</sup>* Gianni would be ready'

(106) \* [a comprarti *t<sup>i</sup>* per il compleanno]*<sup>j</sup>* [penso [che [solo questo regalo]*<sup>i</sup>* [potrei convincere tua moglie *tj*]]]

> 'to buy you *t<sup>i</sup>* for your birthday, I think that [only this present]*<sup>i</sup>* I might be able to persuade your wife'

But in the same configuration parasitic gaps are much better:

(107) ? [senza conoscere *e<sup>i</sup>* prima bene]*<sup>j</sup>* [non so proprio [[quale altra ragazza]*<sup>i</sup>* [Gianni sarebbe disposto a sposare *t<sup>i</sup> tj*]]]

> 'without knowing *e<sup>i</sup>* well beforehand, I really do not know [which other girl]*<sup>i</sup>* Gianni would be ready to marry *t<sup>i</sup>* '

This differential behaviour of *wh*-traces and parasitic gaps poses important questions which will be taken up in Section 6.4.

### **4 Reconstruction**

We have seen that in a number of cases scope assignment and binding of expressions contained in a phrase that Ā-binds a trace may or must consider the position of the trace. How can these facts formally be accounted for?

As to the observations on scope, it seems natural to account for them by mechanisms used in the translation from the syntactic form into a semantic representation. Suppose that a constituent containing a Ā-bound trace is translated in such a way that a variable replaces the trace and a lambda operator binds the variable, as in (108):

$$\begin{aligned} \text{(108)} \quad & \text{a. } \text{XP}\_l \left[ \dots \text{YP} \dots t\_l \dots \right] \\ & \text{b. } \text{XP}'\_{\sigma} \, \lambda \, \text{Z}\_{\tau} \left( \dots \text{YP}' \dots \text{Z}\_{\tau} \dots \right) \end{aligned}$$

In the semantic representation (108b) the Ā-binder XP is represented by an expression XP*′* of type *σ*, and the variable Z corresponding to the trace is of type *τ* . If *σ* is a higher type than *τ* , XP*′* will have scope over the lambda expression; if *σ* = *τ* , YP*′* will have scope over XP*′* . Depending on properties of XP and on intonation, the translation mechanism will fix *τ* equal to *σ* or lower than *σ*.

Unfortunately this simple idea cannot account for the observations on binding, for elementary reasons. If XP contains an expression that is understood to be bound by YP and XP is translated in the usual way, i.e., without taking YP

### 8 On reconstruction and coordination

into account, then XP*′* will contain a free variable that cannot become bound by lambda conversion; cf. Engdahl (1986: 29-32). At the same time it seems obvious that the grammatical principles governing scope and binding are essentially similar. That is, in those cases where the position of the trace must be considered in order for the trace binder to be treated properly, the trace cannot be evaluated by lambda conversion. Rather there must be a different mechanism that is able to account for scope as well as for binding.

The question of how to adequately account for binding phenomena of the kind we have discussed has a long history. One traditional answer is that A-binding relations must be determined at a level (or: at levels) of representation more abstract than S-structure (and surface structure). Proposals differ as to how this level is to be characterized precisely. For concreteness, we may define a level of R-structure as in (109):

	- i. The theories of scope and A-binding apply only at R-structure.
	- ii. If at S-structure some phrase D occupies a Ā-position Pa and binds a trace *t* in an A-position Pb, then at R-structure a representation of D may occupy Pb while Pa is empty. Otherwise, R-structure and Sstructure are identical.
	- iii. Clause (ii) is subject to certain conditions to be specified separately.

If a phrase D is in position Pb at R-structure while it is in position Pa at S-structure, according to clause (ii), I will say that D is 'reconstructed'. (In a moment, "reconstruct" will acquire a second, though related, meaning.) The conditions that (109ii) is subject to may then be tentatively stated as in (110):

	- i. Indefinite NPs and clauses are optionally reconstructed.
	- ii. Verbs and verb projections are obligatorily reconstructed.
	- iii. Definite NPs are obligatorily reconstructed.
	- iv. Truly quantified expressions are reconstructed if and only if they bear rising intonation within an I-Topic intonation pattern.<sup>23</sup>
	- v. There is no other case of reconstruction.

(i) JEDEN / every Hund dog hast have auch even DU \ you dem the Kater cat nicht not zeigen show können can 'even you were not able to show every dog to the cat'

Here *du* 'you' is the focus of the scalar particle *auch* 'even'.

<sup>23</sup>The fall must be on a scope inducing expression (scalar particle, negation, distributive quantifier, etc.) or on the focus of such an expression, as in (i):

This set of conditions seems to give correct results over a fairly broad empirical domain, as the reader may verify by reconsidering Section 3. Naturally there remain many questions of descriptive detail on the one hand, and of theoretical rationalization on the other, which we cannot follow here.<sup>24</sup> Rather, we will explore some consequences of an alternative account for reconstruction phenomena.

There have been various attempts to account for binding facts like those we have seen in Section 3.2 directly at S-structure. To this end, the binding theory must be modified in such a way that A-binding may be mediated somehow by a Ā-bound trace. Proposals to this effect have been made, e.g., by Guéron (1984), Roberts (1985), Williams (1986) and works cited there. For our purpose we may follow Williams's suggestion of generalizing the notion of c-command domain:

### (111) *R-domain:*

	- b. X can be in the scope of Y or X can be A-bound by Y only if X is in the R-domain of Y.
	- c. If X is in the domain of Y, then X is in the R-domain of Y.

Note that the clauses in (ii) are simply reformulations of the standard assumptions for the normal case. Clause (iii) corresponds to clause (ii) of (109). Accordingly, if a phrase D is in the R-domain of A according to (111iii) I will say that D is 'reconstructed'. Hence the conditions (110) apply in this case. To distinguish between the two senses of "reconstruct", I will speak of 'true reconstruction' in the case of (109) and of 'pseudo-reconstruction' in the case of (111).

As it stands, (111) is not exactly equivalent to (109) as long as the characterization of the Opacity Domain (OD, or Governing Category or Binding Category) for A-binding is not modified accordingly. Without such a modification ungrammatical examples such as (112) and (113) would be admitted alongside with their grammatical counterparts (114) and (115):

<sup>24</sup>This remark applies in particular to the treatment of coreference, which on the whole is much less straightforward than Section 3.2.2 makes it appear.

<sup>25</sup>The extension of the scope domain of negation that we observed in (61) and (63) is an exception to the unmarked case. Other types of exceptions will be discussed in Sections 6.4 and 6.5.

### 8 On reconstruction and coordination

	- b. \* sich*<sup>i</sup>* -self glaubt believes Karl*<sup>i</sup>* , Karl daß that ich I liebe love 'Karl believes that I like him(self)'
	- c. \* sich*<sup>i</sup>* -self glaube believe ich, I daß that Karl*<sup>i</sup>* Karl hofft, hopes daß that du you liebst love 'I believe that Karl hopes that you love him(self)'
	- b. \* ihn*<sup>i</sup>* him (selbst) (self) meine mean ich, I daß that jeder*<sup>i</sup>* every rasieren shave sollte should 'I think that everyone should shave him(self)'
	- b. ihn*<sup>i</sup>* glaubt Karl*<sup>i</sup>* , daß ich liebe
	- c. ihn*<sup>i</sup>* glaube ich, daß Karl*<sup>i</sup>* hofft, daß du liebst
	- b. sich*<sup>i</sup>* (selbst) meine ich, daß jeder*<sup>i</sup>* rasieren sollte

Hence we have to revise the binding theory (for German) along the lines of (116):

	- i. X is the Opacity Domain (OD) of Y if and only if X is the smallest constituent that contains a SUBJECT *β* such that Y is in the R-domain of *β*.
	- ii. An anaphor *δ* must be A-bound by a phrase *α* that is contained in the OD of *δ*.
	- iii. A personal pronoun *π* must not be A-bound by a phrase *α* that is contained in the OD of *π*. 26

<sup>26</sup>In German only third person pronouns are subject to (116iii). There is no OD for possessives or for first or second person pronouns. This is a natural state of affairs, as the existence of an OD for a pronominal is induced by the existence of a corresponding lexical anaphor. There are no reflexive possessives and no first or second person reflexives in German. Alternatively, possessives and first/second person pronominals may be considered to be systematically ambiguous in having the OD of a pronoun or the OD of an anaphor.

With this modification (112) and (113) are correctly ruled out, and (111) is equivalent to (109) with regard to the kind of examples we have discussed so far. We will now turn to coordination in order to see whether and how differences between true reconstruction and pseudo-reconstruction may arise there.

### **5 Reconstruction in coordination**

### **5.1 Scope**

Consider an example such as (117) read with normal intonation:

	- b. [fast jeden Hund]*<sup>i</sup>* [[hat Karl *t<sup>i</sup>* gefüttert] oder [hat Heinz *t<sup>i</sup>* gestreichelt]]

Although *fast jeden Hund* 'almost every dog' functions as the direct object of two different verbs (and therefore binds two traces in (117b)), the phrase has scope over the entire coordinate phrase. This fact immediately confirms one aspect of the conditions on reconstruction given in (110): in accordance with (110iv), *fast jeden Hund* is not reconstructed. If it were, (117) would be synonymous with (118), at least under true reconstruction:

(118) Karl hat fast jeden Hund gefüttert oder Heinz hat fast jeden Hund gestreichelt

'Karl fed almost every dog, or Heinz caressed almost every dog'

We may conclude that also in a simple (non-coordinate) case such as (119a) there is no reconstruction, even though (119a) and (119b) are logically equivalent here:

	- b. Karl hat fast jeden Hund gefüttert

The situation is different in (120). This example has a reading equivalent to (121):

	- b. [einen Hund]*<sup>i</sup>* [[haben viele *t<sup>i</sup>* gestreichelt] oder [hat jeder *t<sup>i</sup>* gefüttert]]

8 On reconstruction and coordination

(121) es it haben have viele many einen a Hund dog gestreichelt, caressed oder or es it hat has jeder every einen a Hund dog gefüttert fed

'many people caressed a dog, or everyone fed a dog'

That is, *einen Hund* 'a dog' in the K-position can be understood to be in the scope of both *viele* 'many people' and *jeder* 'everyone'.

In a formal sense this is predicted by true reconstruction (109) as well as by pseudo-reconstruction (111), but there is an important difference. Under true reconstruction, R-structure is the level of representation where scope and binding is determined, hence semantic interpretation proceeds off this level, and in particular the interpretation of coordinate structures proceeds from R-structure. The R-structure representation of (120) is similar to (121) in that the positions of the two traces in (120b) are each occupied by *einen Hund* in (121); hence there is one occurrence of *einen Hund* in the domain of *viele*, and there is another occurrence of *einen Hund* in the domain of *jeder*.

Under pseudo-reconstruction, semantic interpretation proceeds from S-structure. In S-structure there is just one occurrence of *einen Hund*. It is in the Rdomain, hence in the scope, of *viele* and of *jeder* – but that is either nonsensical or false. The problem presents itself lucidly when we make use of Skolem functions. Suppose that *viele* is represented by the variable "x" bound by some suitable quantifier and that *jeder* is represented by the variable "y" bound by the universal quantifier. Being in the scope of *viele, einen Hund* must be represented by "f<sup>1</sup> (x)"; being in the scope of *jeder*, it must be represented by "f2(y)". But for the translation of one and the same expression to be represented in these two ways, it must be the case that f<sup>1</sup> (x) = f2(y). But this is empirically false: (120) is understood in the same way as (121), i.e., f<sup>1</sup> (x) and f2(y) are independent of each other.

The same problem presents itself from a different angle in an example such as (122), which in one reading is equivalent to (123):


'Karl fed a dog, and Heinz caressed a dog'

True reconstruction maps (122) into an R-structure representation similar to (123), the translation of which immediately represents the relevant reading of (122), where there may be two different dogs involved. But pseudo-reconstruction seems to be unable to generate this reading. Although (111) allows *einen Hund* to be 'reconstructed', it is not obvious which effect pseudo-reconstruction may be supposed to have in this case: *einen Hund* is neither A-bound by, nor in the scope of, any other expression. By usual assumptions the interpretation of the coordinate phrase will result in an expression roughly indicated by (124), where "x" is a variable of type e:

(124) ((HAS (FED (KARL, x))) & (HAS (CARESSED (HEINZ, x))))

Since *einen Hund* in (122) must be translated as being existentially quantified, this quantifier will have to bind both occurrences of "x" in (124). But this is not the reading we are interested in. Under the assumptions we made in Section 4 it does not seem possible to get the correct interpretation, as long as we stick to standard assumptions about how to translate coordinate structures semantically (e.g., Partee & Rooth 1983).

A particularly interesting instance of the phenomenon seen in (122) can be observed in (125), which in one reading is equivalent to (126):


That is, the ape that fed the dog need not be the ape that fed the cat. This reading is unavailable in (127):

(127) (es (it ist is wahr) true) daß that ein an Affe ape den the Hund dog gefüttert fed hat has und and den the Kater cat gefüttert fed hat has

'(it is true) that there is an ape that fed the dog and fed the cat'

From an observational point of view, this difference seems surprising. But it fits naturally into the general picture, given the structures of (125) and (127) as shown in (128):

	- b. daß ein Affe [[den Hund gefüttert hat] und [den Kater gefüttert hat]]

### 8 On reconstruction and coordination

In (128b) the subject *ein Affe* is not subject to reconstruction as there is no trace that is Ā-bound by it; hence it has scope over the entire coordinate phrase. In (128a), by contrast, *ein Affe* Ā-binds two traces, and true reconstruction yields a representation that is translated into a semantic representation equivalent to the translation of (126). (Pseudo-reconstruction faces the same problem here as it did with (122), of course.)<sup>27</sup>

Let us finally look at (129) under the reading it shares with (130):

	- b. [einen Hund]*<sup>i</sup>* [hat [[mancher *t<sup>i</sup>* gefüttert] aber [keiner *t<sup>i</sup>* gestreichelt]]]

'some people fed a dog, but no-one caressed a dog'

Here, *einen Hund* is in the scope of *mancher* 'some people' on the one hand, and in the scope of *keiner* 'no-one' on the other hand. This much is correctly predicted by true as well as by pseudo-reconstruction. But true reconstruction generates two occurrences of *einen Hund*, so that the semantic interpretation of the coordinate structure is straightforward at R-structure. Pseudo-reconstruction, by contrast, must do with one occurrence, on which it imposes conflicting demands by requiring it to be at the same time in the scope of negation and outside the scope of negation.

(i) ein an Affe ape hat has den the Hund dog gefüttert fed und and den the Kater cat gefüttert fed 'an ape fed the dog and fed the cat'

Note that (i) can be analyzed in two ways, viz., according to (ii), where there is only one trace bound by *ein Affe*, or according to (iii):


It is plausible that the human parser avoids building up traces as far as possible; hence the preference for (ii).

<sup>27</sup>The reading we observed in (125) is less readily available, although not impossible, in (i):

### **5.2 A-binding**

As we would expect, the observations on scope are paralleled by observations on binding. Consider (131), which is synonymous with (132):

	- b. [sich im Spiegel betrachtet]*<sup>i</sup>* [[hat Heinz selten *ti*] und [hat Karl häufig *ti*]]

True reconstruction maps (131) into an R-structure representation similar to (132), so that one occurrence of *sich* '-self' can be A-bound by *Heinz* and a second occurrence can be A-bound by *Karl*, which is a correct result. According to pseudoreconstruction, *sich* in (131) must be A-bound by *Heinz* as well as by *Karl*. This correctly accounts for the ungrammaticality of (133):

(133) \* sich -self im in.the Spiegel mirror betrachtet viewed haben have die the Jungen boys häufig often und and haben have wir we selten seldom

The reflexive *sich* must be bound, and *die Jungen* 'the boys' is a possible binder under reconstruction. As a consequence of the External Homogeneity Condition (5), reconstruction must apply to each conjunct if it applies to any conjunct; hence *sich* must also find a binder in the second conjunct. As *sich* (3rd person) cannot be bound by *wir* (1st person), the example is ungrammatical. But semantically it is a fault that *sich* is at the same time bound by *Heinz* and by *Karl* in (131). This could make sense if and only if *Heinz* is identical with *Karl* – an incorrect result.

A similar observation holds for (134), which shares a reading with (135):

	- b. [seinen Hund]*<sup>i</sup>* [[hat jeder *t<sup>i</sup>* selber gefüttert] und [hat kaum einer *t<sup>i</sup>* schlecht behandelt]]

8 On reconstruction and coordination

(135) es it hat has jeder*<sup>i</sup>* every*<sup>i</sup>* seinen*<sup>i</sup>* his*<sup>i</sup>* Hund dog selber self gefüttert, fed und and es it hat has kaum hardly einer*<sup>j</sup>* one*<sup>j</sup>* seinen*<sup>j</sup>* his*<sup>j</sup>* Hund dog schlecht bad behandelt treated 'everyone*<sup>i</sup>* fed his*<sup>i</sup>* dog by himself, and hardly anyone*<sup>j</sup>* treated his*<sup>j</sup>* dog badly'

By pseudo-reconstruction, there is one occurrence of *seinen Hund* 'his dog' that is relevant for the determination of A-binding and for semantic interpretation. The possessive *seinen* 'his' can be A-bound by *jeder* 'everyone' and by *kaum einer* 'hardly anyone'. It must, in fact, be bound by each of them; but semantically this is nonsense. R-structure, on the contrary, is similar to (135) in that there are two occurrences of *seinen (Hund)*; consequently the first occurrence can be bound by *jeder* and the second one by *kaum einer*, in accordance with the facts.<sup>28</sup>

### **5.3 Discussion**

While true and pseudo-reconstruction seem to be empirically indistinguishable in simple cases, their effects differ markedly in coordinate structures. The predictions of true reconstruction are consistently correct, whereas the predictions of pseudo-reconstruction are nonsensical or false. Let us briefly reflect on why this is so.

To say that an expression D is 'reconstructed' means that D behaves to a large degree as if it occupied the position of a trace *t* that it Ā-binds. True reconstruction generates a level of R-structure where D does in fact occupy the position of *t*. Consequently, in coordinate structures an occurrence of D is available in each conjunct. By applying the theories of A-binding, of scope determination and of

<sup>28</sup>Nevertheless, there is a problem. As there are two occurrences of the possessive at R-structure and any given possessive is ambiguous between a bound and a referential reading, (134) should be at least four-ways ambiguous; but in fact it is only two-ways ambiguous: the possessive may be referential (referring to one fixed referent), or it may be bound in the way we have discussed. There is no 'mixed' reading. The same observation holds of pronouns, as in (i), where either *j* = *l* = *h*, or *j* = *i* and *l* = *k*:

<sup>(</sup>i) daß that er he gerne gladly trinkt, drinks würde would fast almost jeder every leugnen deny und and würde would kaum hardly einer one zugeben admit 'almost everyone*<sup>i</sup>* would deny that he*<sup>j</sup>* likes drinking, and hardly anyone*<sup>k</sup>* would admit that he*<sup>i</sup>* likes drinking'

Presumably NPs must be determined as being referential or non-referential before reconstruction applies. (Notice that the conditions on reconstruction (110) also rely on a partial semantic characterization of the Ā-binder.) The consequences of this fact remain to be explored.

semantic interpretation at R-structure, D is translated correctly as a part of each conjunct. Pseudo-reconstruction, in contrast, seeks to achieve the same results at S-structure by allowing the expression D to be in the R-domain of expressions it s-commands. However, the notion of R-domain, by itself, does not suffice. Rather an appropriate translation of D must be available in each conjunct of a coordinate structure. The translation of (136a) (= (122)), for example, must have a translation of *einen Hund* 'a dog' as part of the translation of each conjunct. The translation of (136b) (= (134)), again, must have a translation of *seinen Hund* 'his dog' as part of the translation of each conjunct, and each of them must contain a different variable:

(136) a. einen Hund hat Karl gefüttert und hat Heinz gestreichelt

'Karl fed a dog, and Heinz caressed a dog'

b. seinen Hund hat jeder selber gefüttert und hat kaum einer schlecht behandelt

'everyone*<sup>i</sup>* fed his*<sup>i</sup>* dog by himself, and hardly anyone*<sup>j</sup>* treated his*<sup>j</sup>* dog badly'

If we wish to obtain these results not at R-structure but at S-structure, we have to introduce the assumptions singled out in (137):

	- i. In a coordinate structure each conjunct *<sup>i</sup>*B is separately evaluated with respect to the elements *<sup>j</sup>*A that are external to the conjuncts (cf. (1)).
	- ii. Under reconstruction the expression D is translated during the evaluation of a phrase P that is s-commanded by D, so that an appropriate translation of D is part of the translation of P.

Note that condition (ii) does not seem to introduce problems of a formal nature. We have been supposing throughout that the relation of the trace *t* contained in P to its Ā-binder D can be recognized at S-structure, hence D can be made accessible for the purpose of evaluating P.<sup>29</sup> In accordance with (i), then, the expression D will be translated as many times as there are conjuncts containing a trace Ā-bound by D. But condition (i) seems problematic. Although it resembles

<sup>29</sup>In this regard an S-structure representation from which Ā-binding relations can be retrieved would seem to be equivalent to a phrase linking grammar representation such as is used by Engdahl (1986). The evaluation of P cannot be done strictly compositionally at S-structure, in any case.

### 8 On reconstruction and coordination

the way the External Homogeneity Condition on coordinate structures was put in (5), it contradicts the way that semantic interpretation of coordinate structures is standardly thought to be done (e.g., by Partee & Rooth 1983). The standard assumption is that the translation of the external elements *<sup>j</sup>*A combines with the translation of the entire coordinate phrase, whose translation in turn results from combining the translations of the conjuncts *<sup>i</sup>*B. We have seen that this method of interpretation can be successfully applied at R-structure but not at S-structure. It is not obvious, though, whether there are strong reasons to prefer the standard assumption over (137i).

In the next section we will turn to some considerations that might help in deciding between true and pseudo-reconstruction and, by implication, between the standard assumptions about coordination and (137i).

### **6 Pseudo-reconstruction or true reconstruction?**

### **6.1 Ā-binding: Strong crossover**

As a possible argument for true reconstruction, consider strong crossover:

(138) a. \* who*<sup>i</sup>* does he*<sup>i</sup>* like *e<sup>i</sup>*

> b. \* he*<sup>i</sup>* likes who*<sup>i</sup>*

It seems natural to relate the impossibility of (138a) to the impossibility of (138b). In the latter, *who* cannot A-bind *he* since it is s-commanded by *he*, and *who* cannot be bound at all; cf. Wasow (1979) and Riemsdijk & Williams (1981). For this kind of explanation to be successful, however, it would have to be necessary that Ā-binding of *he* by *who* in (138a) is theoretically excluded. But why should Ābinding of *he* be excluded? It is true that English does not favour Ā-binding of pronominals, but it does occur in weak crossover constructions (which are incomparably better than strong crossover constructions, as Wasow (1979) takes pains to demonstrate). Also, there are languages such as Swedish that even require resumptive pronouns under certain conditions, although they disallow strong crossover configurations just as English does. The same question arises with parasitic gap constructions: why is (139a) impossible although Ā-binding of a secondary gap is possible in (139b)?

	- b. Bill is the kind of person whom*<sup>i</sup>* everyone who knows *e ′ <sup>i</sup>* dislikes *e<sup>i</sup>*

It seems that a principle such as (140) must be stipulated:

(140) *Restriction on multiple binding:*

If an A-position P<sup>1</sup> is in the unmarked (i.e., s-command) domain of an Aposition P<sup>2</sup> and the category in P<sup>2</sup> is bound by some category E, then a category in P<sup>1</sup> cannot be bound by E.<sup>30</sup>

By (140), *e* in (138a) and (139a) cannot be bound by *who* since, by assumption, *he* and *e ′* are. As an empty category can occupy the position of *e* only if it is Ā-bound, configurations like these are ruled ungrammatical at S-structure. If this account is correct, reconstruction does not have anything to contribute to an explanation of strong crossover.

### **6.2 Verum focus**

In Section 3.1.3 we considered examples such as (141) (= (84b)):

	- 'no-one does listen to me'

There we concluded (i) that a meaning component symbolized as 'VERUM' is associated with the FIN-position and (ii) that VERUM can be in the scope of the negation because *hört* Ā-binds a trace that is in the domain of the negation. If this is to be accounted for by true reconstruction, VERUM must somehow be picked up by the verb *hört* and taken along into the position of the trace. But why and how should the verb be able to do that? It is the FIN-position that VERUM is associated with, and there is no independent reason for assuming that this situation may change during the derivation. It seems more adequate, hence, to assume that the scope of negation with respect to VERUM is accounted for by pseudo-reconstruction.

### **6.3 Lexical anaphors**

In Section 4 we noted that for pseudo-reconstruction to work properly in German, the characterizations of the Opacity Domain of anaphors and pronominals had to be adjusted as in (116). For many speakers of English just the same considerations apply. However, a number of authors have observed that a subset of speakers do allow lexical anaphors to be bound in exactly those configurations that are impossible in German:<sup>31</sup>

<sup>30</sup>It follows that the relation of binding is intransitive, at least insofar as it observes s-command. I will in fact assume that it is always intransitive, even if s-command is not observed.

<sup>31</sup>See Weisler (1983). Furthermore, see Reed (1978) for (142b,c); Jacobson & Neubauer (1976), Rouveret & Vergnaud (1980) and Williams (1986) for (142a); Langendoen & Battistella (1982) and Guéron (1984) for (142b), and also Engdahl (1986: 112) for Swedish and Kitagawa (1986: ch. 4.3.8) for Japanese.

8 On reconstruction and coordination

(142) a. Mary wonders which picture of herself John will prefer *t*


In the system of those speakers who accept (142) the reflexive contained in the phrase D (*which picture of herself* ) can be bound by any phrase α that scommands the reflexive or the trace of D, as long as α does not s-command an accessible SUBJECT that s-commands the reflexive.

If we wish to account for these data by true reconstruction, we must allow an expression D that contains a lexical anaphor (but not a pronoun) to optionally replace an intermediate trace in a Ā-position, rather than a trace in an A-position.

Under pseudo-reconstruction the characterization of the OD of lexical anaphors, repeated in (143), must be modified as in (144):

	- ii. Otherwise, the whole sentence is the OD of *δ*.

In (144i) "R-domain" of (143) is replaced by "domain", and in (144ii) the OD gets a default characterization. The effect is that the OD is directly determined by the s-command relations, without any appeal to the base position of D. In this sense (144) can be viewed as a natural generalization of (143). This is as we would expect, given that the system exemplified in (142) constitutes the marked case in relation to the more restricted versions of English and German, and that marked extensions of the unmarked case should be rationalizable in terms of generalization and simplification.

The extensions required for true reconstruction, by contrast, do not seem equally natural. If there is reconstruction, we expect the base position of D to be involved, as this position is naturally relevant for semantic interpretation. But reconstruction into an intermediate Ā-position seems an artificial consequence of the initial assumptions, rather than a natural generalization of the unmarked system. Conceptually, then, the accounts given for (142) by pseudo-reconstruction and by true reconstruction are very different, with true reconstruction looking distinctly suspicious.

### **6.4 Ā-binding: Parasitic gaps**

We noted in Section 3.2.3 that a trace of ordinary *wh*-movement must be bound under s-command at S-structure, while a parasitic gap need not;<sup>32</sup> cf. (145) (= (105)) and (146) (= (107)):

(145) \* [a sposare *ti*]*<sup>j</sup>* [non so proprio [[quale ragazza]*<sup>i</sup>* [Gianni sarebbe disposto *tj*]]]

> 'to marry *t<sup>i</sup>* , I really do not know [which girl]*<sup>i</sup>* Gianni would be ready'

(146) ? [senza conoscere *e<sup>i</sup>* prima bene]*<sup>j</sup>* [non so proprio [[quale altra ragazza]*<sup>i</sup>* [Gianni sarebbe disposto a sposare *t<sup>i</sup> tj*]]]

> 'without knowing *e<sup>i</sup>* well beforehand, I really do not know [which other girl]*<sup>i</sup>* Gianni would be ready to marry *t<sup>i</sup>* '

With respect to a true *wh*-trace there do not seem to be technical problems. At S-structure the checking mechanism takes a phrase occupying a Ā-position and looks for a trace s-commanded by it. In (145) a trace (viz., *t<sup>j</sup>* ) corresponding to *a sposare* is found, but there is no trace s-commanded by *quale ragazza*; hence this configuration is ungrammatical. In (146) a trace (*t<sup>j</sup>* ) corresponding to D*<sup>j</sup>* (*senza conoscere prima bene*) as well as a trace (*t<sup>i</sup>* ) corresponding to D*<sup>i</sup>* (*quale altra ragazza*) is found; hence this configuration is grammatical with respect to binding of traces of true *wh*-movement.<sup>33</sup> But how is the parasitic gap *e<sup>i</sup>* in (146) formally licensed?

With true reconstruction the phrase D*<sup>j</sup>* containing *e<sup>i</sup>* must be reconstructed into the position of the trace *t<sup>j</sup>* that it Ā-binds, in order for *e<sup>i</sup>* to be s-commanded by a Ā-binder. This will work as long as the Ā-binder D*<sup>i</sup>* that licenses the parasitic gap is not reconstructed by itself. But suppose it must be reconstructed, for example, if it contains a reflexive. In this case the parasitic gap cannot be licensed

(i) after visiting Bill, who did you hire

(ii) \*without reading, which report did you file

<sup>32</sup>Unlike Italian, English strongly resists extraction from *wh*-interrogatives, in particular extraction of adjuncts. The initial adverbial in (i), therefore, cannot result from extraction (cannot bind a trace):

We consequently expect English examples corresponding to (146) to be distinctly bad, and in fact E. McNulty observed that they are:

See Lasnik & Uriagereka (1988: 75).

<sup>33</sup>A similar mechanism must apply for the determination of antecedent-government, if the account proposed for (104) is correct.

### 8 On reconstruction and coordination

at R-structure. But by hypothesis, binding relations that are relevant for parasitic gaps are determined at R-structure. (If they were determined at S-structure, (146) should be ungrammatical in the same way as (145).)

The point may also be illustrated by examples adapted from K. Kearney (cited by Chomsky 1986a: 60):

(147) a. which books about himself did John file *t* before Mary could read *e* b. \* which books about herself did John file *t* before Mary could read *e*

While (147a) may be slightly marginal for some speakers, (147b) is impossible. Under true reconstruction, the binding relations of both *himself* and *e* must be determined at R-structure. But if the antecedent of *t* is reconstructed, as in (148), it can no longer license *e*:

(148) \* John filed which books about himself before Mary could read *e*

We must conclude that parasitic gaps are licensed at S-structure. But at S-structure, true reconstruction cannot license (146) or (147a). Hence true reconstruction must give way to pseudo-reconstruction.

The examples (147) show more than this. The binding relations of the reflexive must be determined (by pseudo-reconstruction) with reference to *t*, not to *e*. Although *e* is licensed by D (*which books about himself* ), D is not reconstructed with respect to *e*. The same fact is apparent from the meaning of the sentences. (147a) corresponds to (149), but not to (150):

	- b. John filed some books about himself before Mary could read them

That is, the parasitic gap in (147a) as well as the pronoun *them* in (149) is anaphoric to the phrase *which*/*some books about himself*, with *himself* bound by *John*. In this regard, *e* does not behave like a trace Ā-bound by D, but like a pronoun A-bound by *t*. In fact, although the position of *e* (presumably) is not s-commanded by the position of *t*, it is in its domain, as shown by (151):

	- b. John filed [no book]*<sup>i</sup>* before Mary could read it*<sup>i</sup>*

Here *it* is A-bound by the quantified phrase in the object position of *filed*. 34

<sup>34</sup>See Engdahl (1986: 300) for similar observations on Swedish.

Note also that (149a) does not show any weak crossover effect. Such an effect would be expected if *them* were Ā-bound by D in the way that *t* is. In parasitic gap constructions of the type shown in (152a) substitution of a pronoun for the empty category in fact yields the typical weak crossover effect, see (152b). With this type, binding from the position of *t* into the position of *e* is not possible, as shown by (152c):

	- b. ⁇ he is the kind of person whom*<sup>i</sup>* everyone who knows him*<sup>i</sup>* dislikes *ti*
	- c. \* many people who know him*<sup>i</sup>* dislike everyone*<sup>i</sup>*

Clearly the properties of parasitic gap constructions like (147) and their difference from those like (152a) call for some elaboration of theoretical assumptions.

We may begin by distinguishing two different aspects of binding. First, binding has a purely syntactic aspect which need not have any semantic counterpart; call this s-binding. It appears that pure s-binding holds in constructions with obligatory reflexives that are often found in Slavic and Germanic languages (other than English):

	- b. Karl Karl kümmert worries sich -self um about die the Kinder children 'Karl sees to the children'

It can be demonstrated that these reflexives are semantically empty (they do not bear a *θ*-role).

Second, binding typically has a semantic (or 'functional') aspect in that the possible semantic value of a bound expression is determined by its binder; call this f-binding.<sup>35</sup> The pronoun *it* in (151) is f-bound by the object of *filed*. By the same token, I will assume that *them* in (149) and *e* in (147a) are f-bound by the object of *file(d)* (the trace in (149a) and (147a)).

I will assume, furthermore, that for proper binding to be possible, the bindee must be s-bound and if it bears a *θ*-role, it must also be f-bound. In (147a) and (149a) the trace *t* is s-bound and f-bound by D (*which books about himself* ). The

<sup>35</sup>It seems that virtually the same distinction between two aspects of binding has been made by Chomsky (1986b: 85).

### 8 On reconstruction and coordination

pronoun *it* in (151) is s-bound (and f-bound) by *every book*/*no book*. In (149a) *them* is s-bound (and f-bound) by the trace. But in (147a) I assume the parasitic gap *e* is not s-bound by *t* (although it is f-bound by *t*). Rather I propose that *e* is sbound by D, the Ā-binder of *t*. That is, I assume that in this type of construction s-binding and f-binding of one category (viz., *e*) can be exercised by different binders.<sup>36</sup> In (152), by contrast, it is obvious from (152c) that the object position of *know* cannot be s-bound by the object position of *dislikes*. Hence *him* in (152b) must be s-bound by *whom*. English strongly disfavours s-binding of an anaphoric expression by a Ā-binder, hence the marginality of (152b). In (152a) both *t* and *e* are s-bound by *whom*; *t* is f-bound by *whom*, and *e* presumably may be too.

Let us now return to the Italian case (154a) (= (146)) with the schematic structure (l54b):

	- b. [… *e<sup>i</sup>* …]*<sup>j</sup>* [… [E*<sup>i</sup>* [… *t<sup>i</sup> tj*]]]

This is a parasitic gap construction of the type seen in (147). The f-binding of *ei* is naturally accounted for under pseudo-reconstruction, as it is a case of Abinding (by *t<sup>i</sup>* ), assuming that the preposed adverbial clause falls under (110i). We must also allow s-binding of *e<sup>i</sup>* by *E<sup>i</sup>* to be possible under reconstruction. This is somewhat surprising, given that traces of true *wh*-movement are not licensed by reconstruction. The conclusion seems to be that a Ā-binder is not allowed to have its f-binding relations determined by reconstruction.

### **6.5 Ā-Binding: Weak crossover**

To broaden the view on s-binding and f-binding, we may add some observations on weak crossover. Consider (155) and (156):

(155) a. ? wem*<sup>i</sup>* whom würden would seine*<sup>i</sup>* his Eltern parents *t<sup>i</sup>* ein a Auto car schenken donate 'for whom is it true that his parents would give him a car?'

<sup>36</sup>But naturally if *β* is s-bound by *α*, the semantic value of *β* must be determined by *α*. Hence either *α* f-binds *β*, or *α* f-binds *δ* and *δ* f-binds *β*. I continue assuming that binding is intransitive (cf. note 30), but I now restrict this assumption to any given type of binding (s-binding/f-binding). Hence in (147a), both *t* and *e* may be s-bound by D, as long as *e* is not s-bound by *t*. Notice that (147a) does not violate (140), since binding of *e* by *t* does not observe s-command.

b. ? [fast almost jeden every Lehrer]*<sup>i</sup>* teacher haben have seine*<sup>i</sup>* his Schüler students schon already mal once *ti* reingelegt cheated

'it is true of almost every teacher that his students cheated him at least once'

	- b. ?\* deshalb therefore haben have seine*<sup>i</sup>* his Schüler students [fast almost jeden every Lehrer]*<sup>i</sup>* teacher schon already mal once reingelegt cheated

'therefore his students cheated almost every teacher at least once'

While the judgements on (155) vary considerably with speakers and types of Ābinders, the crossover effect is in any case weak, and many speakers find examples like these perfectly unobjectionable. (156) on the other hand is decidedly marginal. It appears, then, that the possessive (*seine* 'his') in (155) can be bound because it is s-commanded by its semantic antecedent at S-structure. That is, the weak crossover configuration is a kind of parasitic Ā-binding much like parasitic gap configurations are. We must also assume that German disfavours Ā-binding of possessives (and pronominals) to a much smaller degree than English does.

We must ask, then, what kind of binding is involved. The possessive can hardly be both s-bound and f-bound by its Ā-binder. If it were, – i.e., if a pronominal expression could be s-bound and f-bound by a Ā-binder just like empty categories can – we would expect resumptive pronominals to be possible in German at least to the extent that they are, for example, in Swedish. However, resumptive pronominals are possible in German at best to the degree that they are in English. Hence we have to choose between s-binding and f-binding, and the possessive must have different binders for s-binding and f-binding, just as parasitic gaps may have two different binders. We may conjecture that in cases like these it is always s-binding that is determined by s-command. If so, we must assume that the possessive is f-bound by the trace that is Ā-bound by the s-binder of the possessive.

This assumption finds some support in long extractions such as (157) and (158):

8 On reconstruction and coordination

(157) a. wem*<sup>i</sup>* whom würden would deine your Eltern parents sagen, say daß that du you *t<sup>i</sup>* unter under die the Arme arms greifen sollst

grip should

'for whom is it true that your parents would say that you should help him'


'it is true of almost every teacher that your colleagues said that you cheated him at least once'

b. \* [fast jeden Lehrer]*<sup>i</sup>* haben seine*<sup>i</sup>* Kollegen gesagt, daß du schon mal *t<sup>i</sup>* reingelegt hast

The (a)-cases, with a second person possessive (*deine* 'your') contained in the matrix subject, are fully acceptable (for speakers who make use of long extractions). In the (b)-cases the third person possessive (*seine* 'his') should be able to be bound by the preposed phrase; however, the bound reading is judged to be very bad even by speakers who judge (155) and the (a)-cases of (157), (158) to be impeccable. This state of affairs is not surprising under the assumption that the possessive must be f-bound by the trace. For this to be possible at all, we have to assume that f-binding – as opposed to s-binding – may rather liberally disregard s-command, perhaps in the way that quantifier scope does (in the marked case). But we would not expect f-binding to extend upwards out of its clause, just as scope typically does not. Consequently, the possessive can be f-bound by the trace in (155) but not in (157b) and (158b). The binding relation in (155), then, is similar to the one argued for in connection with (154) and (147), namely, it is determined by s-binding from a Ā-position and f-binding from an A-position.

These results lead us to reconsider (159) (= (152a)):

(159) he is the kind of person whom*<sup>i</sup>* everyone who knows *e<sup>i</sup>* dislikes *t<sup>i</sup>*

In Section 6.4 we assumed that *e* here may be f-bound by *whom*. But now it seems probable that *e* is f-bound by *t*. In fact the long extraction in (160) appears to be significantly worse than (159):

(160) ?\* he is the kind of person whom*<sup>i</sup>* everyone who knows *e<sup>i</sup>* believes that many students admire *t<sup>i</sup>*

If these speculations are correct, an interesting generalization emerges:

(161) *Conjectures about Ā-binding:*


### **7 Conclusion**

In the course of the main discussion we considered two ways of construing 'reconstruction': true reconstruction, which involves an abstract level of representation, R-structure; and pseudo-reconstruction, which tries to do without such an extra level. Coordination showed that pseudo-reconstruction must be bought at a price: the standard view of the way coordinate structures are translated into the semantics must be abandoned. Although the translation mechanism that is needed under pseudo-reconstruction does not seem to pose extraordinary technical problems, one would not like to give up the standard view if not forced to. Consideration of some further kind of data – in particular, certain parasitic gap constructions – led us to conclude that true reconstruction cannot consistently achieve the results it is designed for. If these conclusions are correct, reconstruction is done at S-structure, and consequently the theory of semantic translation for coordinate structures must be revised in the way indicated in (137).

Conceptually this is an interesting result. Natural intuition would lead us to expect phenomena to fall into one of two classes: they should either be typical of S-structure or of reconstruction. Hence, many observers feel that true reconstruction is the natural way to account for reconstruction phenomena, and that pseudo-reconstruction, while technically possible, may be a descendant of ideological preconception rather than of open-minded inquiry. However, parasitic Ā-binding characteristically involves S-structure and reconstruction at the same time, and hence, pseudo-reconstruction.

The reason why parasitic Ā-binding can have its somewhat paradoxical properties seems to reside in the fact that under certain conditions two aspects of binding – viz., f-binding and s-binding – that normally go hand in hand can to some extent be dissociated from each other. If f-binding were necessarily coupled with s-binding, there would presumably be no parasitic binding at all, and

8 On reconstruction and coordination

we would not have been able to see as clearly that true reconstruction is not available in natural language.

### **References**

Aoun, Joseph. 1985. *A grammar of anaphora*. Cambridge, MA: MIT Press.


*Akten des VII. Internationalen Germanisten-Kongresses Göttingen 1985.* Vol. 3: Walter Weiss, Herbert Ernst Wiegand & Marga Reis (eds.)*, Textlinguistik contra Stilistik? – Wortschatz und Wörterbuch – Grammatische oder pragmatische Organisation von Rede?*, 329–340. Tübingen: Niemeyer. [Chapter 6 in this volume, pp. 279–294].


### **Chapter 9**

## **Projektionsstufen bei V-Projektionen: Bemerkungen zu Frey/Tappe (1991)**

Tilman N. Höhle

### **0 F/Ts Vorschläge**

Tappe und Frey schlagen in F[rey]/T[appe] (1991) vor, daß sich Objekte, Adverbiale und Subjekt im S-Feld von E-Sätzen des Deutschen und des Niederländischen im Allgemeinen in einer 'basisgenerierten Adjunkt-Position' befinden. Wenn es Phrasenstrukturregeln geben würde, könnte man diese Struktur durch eine rekursiv anzuwendende Regel wie (1) beschreiben:

(1) V <sup>i</sup> *→* X max V <sup>i</sup> wobei Xmax Objekt, Adverbial oder Subjekt sein kann

Diese Annahme hat nützliche Konsequenzen, und ich will sie als korrekt betrachten. Nach F/T ist in (1) i = 2. Diese Annahme halte ich für zweifelhaft; vgl. Abschnitt 2.

Der hier vorliegende Abdruck ist an das Standardformat dieses Bandes angepasst; textuelle Eingriffe beschränken sich auf die Spezifizierung der S. 373, 376 nur durch Namen angedeuteten (mutmaßlichen) Literaturverweise (in eckigen Klammern), die dem Literaturverzeichnis hinzugefügt sind. Zu den hier verwendeten Begriffen (S-Feld, E-Satz, F-Satz, etc.) vgl. *Topologische Felder*, in diesem Band Kapitel 1, S. 7–89) und *Der Begriff ,Mittelfeld'* (Kapitel 6 in diesem Band, S. 279–294).

Tilman N. Höhle. 2019. Projektionsstufen bei V-Projektionen: Bemerkungen zu Frey/Tappe (1991). In Stefan Müller, Marga Reis & Frank Richter (Hrsg.), *Beiträge zur deutschen Grammatik. Gesammelte Schriften von Tilman N. Höhle. Zweite durchgesehene Auflage*, 369–379. Berlin: Language Science Press. DOI:10.5281/zenodo.2588363

<sup>§</sup>*Anmerkung der Herausgeber:* In dieser bisher unveröffentlichten Arbeit (vom 03.04.1991) kommentiert Höhle ein Papier von Werner Frey und Hans-Thilo Tappe (vom 30.01.1991), das als Grundlage eines – im Rahmen des SFB 340 "Sprachtheoretische Grundlagen für die Computerlinguistik", 1989ff. zu entwickelnden – GB-Fragments gedacht war. Die kommentierte 1991er Version des letzteren Papiers ist nach Auskunft der Verfasser nicht mehr verfügbar; eine überarbeitete Version (vom September 1992) befindet sich auf der Homepage von Werner Frey (http://www.zas.gwz-berlin.de/fileadmin/mitarbeiter/frey/SyntaxMF.pdf, letzter Zugriff: 06. Februar 2018).

Tappe und Frey schlagen weiter vor, daß es im S-Feld Verbprojektionen gibt, die nicht durch (1) beschrieben werden können, sondern durch eine – nicht rekursiv anzuwendende – Regel wie (2) zu erfassen sind:

(2) V <sup>1</sup> *→* (Ymax) V<sup>e</sup> , wobei Ymax andere Charakteristika als die Xmax von (1) hat

Diese Annahme will ich hier nicht problematisieren. Nach F/T ist V<sup>e</sup> = V<sup>0</sup> . Das halte ich für zweifelhaft.

### **1 V <sup>e</sup>** *̸*= **V 0**

Am Ende des S-Felds finden sich Kollokationen von VZ ('Verbzusatz', Konverb) und Verb. Diese können (im Ndl.) oder müssen (im Dt.) eine Konstituente bilden, die massiv verschieden von dem V<sup>1</sup> in (2) zu sein scheint. Man kann sie sinnvoll durch V<sup>e</sup> in (2) repräsentieren. V<sup>e</sup> hat zwar z. T. ähnliche Eigenschaften wie ein Wort (genauer: wie ein Kompositum); z. B. kann V<sup>e</sup> an der Verbinversion im Ndl. teilnehmen, vgl. (3a). Aber V<sup>e</sup> kann nicht mit V<sup>0</sup> identifiziert werden, wenn man unter V<sup>0</sup> ein Wort wie z. B. *ruft* in (4a) versteht; denn sonst wäre (4b) statt (4a) zu erwarten, und (3b) sollte unmöglich sein.


Generell sind am Ende des S-Felds – also an einer Stelle, von der eine V-Projektion ausgeht – derartige wortähnliche V<sup>e</sup> -Konstituenten möglich, während sie in der FINIT-Position von F-Sätzen – also in der Landeposition der 'Verbbewegung' – nicht möglich sind. Ganz deutlich ist das bei den sog. 'verbalen Pseudokomposita' wie *uraufführ*-, *zwischenfinanzier*-, *wettruder*-, *rückfrag*- usw. Die kommen (bei beträchtlichen idiolektalen Bewertungsunterschieden im Einzelfall) finit zwar z. T. in E-Sätzen vor, nicht aber in F-Sätzen:

	- b. wenn wir euch den Bau zwischenfinanzieren
	- c. wenn die morgen wettrudern
	- d. falls die dann rückfragen

### 9 Projektionsstufen bei V-Projektionen

	- b. \* wir zwischenfinanzieren euch den Bau
	- c. \* die wettrudern morgen
	- d. \* die rückfragen dann
	- ii. a. \* die führen das Stück urauf
		- b. \* wir finanzieren euch den Bau zwischen
		- c. \* die rudern morgen wett
		- d. \* die fragen dann rück
	- iii. [<sup>V</sup> <sup>k</sup> uraufführen]<sup>i</sup> werden die das Stück wohl kaum t<sup>i</sup>

Daraus ergibt sich nebenbei, daß die – beliebte, aber durch nichts begründete – Annahme (7) in Widersprüche führt:

(7) In E-Sätzen ist das finite Verb mit einer I<sup>0</sup> -Position assoziiert und bindet von dort aus eine V<sup>0</sup> -Spur in einer V-Projektion.

Wenn die finiten Verben von (5) eine Spur von der Kategorie V<sup>0</sup> binden könnten (nach dem Motto: Der Verbstamm bewegt sich nach I<sup>0</sup> , um dort mit den Finitheitsmerkmalen assoziiert zu werden), wäre nicht zu verstehen, wieso sowohl (6i) als auch (6ii) von vielen Sprechern abgelehnt wird, die (5) akzeptieren. Dabei können die 'Pseudokomposita' durchaus eine Spur binden, solange die von höherer Projektionsstufe ist wie in (6iii), wo 0 < k ist. Wenn dagegen *uraufführen* usw. in (5) die V<sup>e</sup> -Position einnehmen, hat man einen Ausgangspunkt, von dem aus man die Datenkonfiguration deuten kann.

Besonders auffällig sind 'Pseudokomposita' wie *bauspar*- und *bauchred*-. Viele Sprecher akzeptieren die finit in E-Sätzen (8), aber nur mit größtem Zögern in F-Sätzen wie (9i) und überhaupt nicht in solchen wie (9ii):

	- b. daß da mal wieder etliche Leute bauchreden
	- b. ⁇ da bauchreden mal wieder etliche Leute
	- ii. a. \*\* wieviele Leute sparen in Zukunft noch bau?
		- b. \*\* da reden mal wieder etliche Leute bauch

Der Kontrast (9i) vs. (9ii) zeigt, daß eine Zerlegung dieser Pseudokomposita überhaupt nicht in Frage kommt. Daß viele Sprecher trotzdem (9i) weitaus weniger

leicht als (8) akzeptieren, kann man wieder so deuten, daß *bausparen*/*bauchreden* in (8) eine V<sup>e</sup> -Position einnehmen, gegen deren Struktureigenschaften sie nicht verstoßen, während sie in (9i) eine V<sup>0</sup> -Position einnehmen würden (und dabei gegen die Struktureigenschaften von V<sup>0</sup> verstoßen). Daraus ergibt sich nebenbei, daß die – unter gewissen Annahmen denkbar erscheinende – Hypothese (10) nicht korrekt sein kann:

(10) Einfache Ketten der Form 'NP – finites Verb' bilden in E-Sätzen die gleiche V-Projektion wie in F2-Sätzen.

Denn viele Sprecher unterscheiden zwischen einem indirekten Interrogativsatz wie (11a) mit *bausparen* als V<sup>e</sup> und dem entsprechenden direkten W-Interrogativsatz (11b) mit *bausparen* als V<sup>0</sup> :

	- b. ⁇ wieviele Leute bausparen?

Demgemäß ist *schnarcht* in (12a) ein V<sup>e</sup> , von dem eine V-Projektion ausgeht, während es in (12b) ein V<sup>0</sup> ist, von dem keine V-Projektion ausgeht:

	- b. Karl schnarcht

Zusammengefaßt ergibt sich (13):

	- ii. Es gibt keine 'Bewegung' von V<sup>0</sup> nach I<sup>0</sup> in E-Sätzen.
	- iii. Von dem finiten Verb V<sup>0</sup> in F-Sätzen geht keine V-Projektion aus.

Wie die Struktureigenschaften von V<sup>e</sup> und V<sup>0</sup> (besonders im Blick auf die 'Pseudokomposita') genau zu formulieren sind, liegt nicht auf der Hand. Es dürfte vorteilhaft sein, diese Frage nicht jetzt im Entwurf eines 'Fragments' eilig lösen zu wollen. Aber bei allen inhaltlichen Erwägungen über V-Projektionen muß man den Unterschied zwischen V<sup>e</sup> und V<sup>0</sup> im Auge behalten.

### **2 V <sup>i</sup> = V<sup>1</sup>**

**2.1** Tappe und Frey nehmen an, daß die durch (1) beschriebenen 'Adjunktstrukturen' V-Projektionen der Stufe 2 sind. In F/T (1991) finden sich zwei Aussagen als Begründung für diese Annahme. Die erste ist in (14) zitiert:

9 Projektionsstufen bei V-Projektionen

(14) " Zu diesen [sc. etablierten Vorstellungen] zählen wir u. a. die Annahme […] des Ausschlusses der X<sup>1</sup> -Rekursion." (F/T 1991: 3)

Es ist in empirischer wie in theoretischer Hinsicht unklar, worauf sich diese Annahme stützt. Rekursion über X<sup>1</sup> ist mindestens für den Bereich der NP die Standardannahme in der Literatur, und weder in F/T (1991) noch sonstwo wird deutlich gemacht, was gegen diese Annahme sprechen würde. Bis zum Beweis des Gegenteils halte ich (14) für willkürlich.

Die zweite Begründung ist in (15) zitiert:

(15) " Wir weisen weiter darauf hin, daß es die V<sup>2</sup> -Adjunktionsidee erlaubt, hinsichtlich der Vorfeldbesetzung deren Beschränkung auf X<sup>2</sup> -Konstituenten mit der Möglichkeit […] der Vorfeldbesetzung durch eine V-Projektion bei gleichzeitiger Strandung gewissen V<sup>2</sup> -internen Materials zu verbinden, weil sie die notwendigen V<sup>2</sup> -Konstituenten bereitstellen kann […]." (F/T 1991: 5)

Diese Überlegung (die ursprünglich – in etwas anderer Form – von Thiersch [= Thiersch (1985)] stammt und später von den Besten und Webelhuth [= Webelhuth & den Besten (1987)] populär gemacht worden ist) hat die Struktur (16):

	- ii. Das Vorfeld ist eine Landestelle für Bewegungen des klassischen Typs.
	- iii. Bei Bewegungen des klassischen Typs können nur maximale Projektionen involviert sein.
	- iv. Also sind sämtliche V-Projektionen im Vorfeld Vmax .
	- v. Maximale Projektionen sind X<sup>2</sup> .
	- vi. Also sind auch entsprechende Ketten im S-Feld sämtlich V<sup>2</sup> .

Die Annahmen (16i) und (16ii) sind unstrittig. Annahme (16iii) will ich hier nicht in Zweifel ziehen, mithin will ich auch (16iv) akzeptieren. Der Begriff der 'maximalen Projektion' enthält jedoch eine Unklarheit. Bevor wir darauf und auf die kritische Annahme (16v) eingehen, ist noch eine Bemerkung zu (16vi) zu machen.

**2.2** Nach den bisherigen Überlegungen muß man annehmen, daß in Beispielen wie (17) jeweils α = Vmax ist. Es ist völlig plausibel, anzunehmen, daß in den E-Sätzen von (18) bei den entsprechenden Ketten mit finitem Verb ebenfalls jeweils β = Vmax ist.

	- b. [<sup>α</sup> einen Brief gezeigt] hat Karl den Kindern
	- c. [<sup>α</sup> den Kindern einen Brief gezeigt] hat Karl
	- b. daß Karl den Kindern [<sup>β</sup> einen Brief zeigt]
	- c. daß Karl [<sup>β</sup> den Kindern einen Brief zeigt]

(Entsprechend z. B. in (6iii) und (5a).) Eben solche Strukturen werden von (1) und (2) zugelassen. Dabei setzt die Annahme von F/T, daß in (1) i = 2 ist, natürlich eine zusätzliche Strukturanweisung wie (19) voraus:

(19) V <sup>2</sup> *→* V 1

Diese Annahmen lassen jedoch offen, wie die Struktur des S-Felds bei (17) ist. Man kann jeweils 2 Spuren annehmen; es ist aber u. a. nicht klar, ob der Aufbau wie in (20i) oder wie in (20ii) ist (und es gibt weitere denkbare Alternativen):

	- b. [<sup>α</sup> einen Brief gezeigt]<sup>i</sup> hat<sup>j</sup> [<sup>α</sup> Karl [<sup>α</sup> den Kindern ti]] t<sup>j</sup>
	- c. [<sup>α</sup> den Kindern einen Brief gezeigt]<sup>i</sup> hat<sup>j</sup> [<sup>α</sup> Karl ti] t<sup>j</sup>
	- ii. a. [<sup>α</sup> gezeigt]<sup>i</sup> hat<sup>j</sup> [<sup>α</sup> Karl [<sup>α</sup> den Kindern [<sup>α</sup> einen Brief [<sup>γ</sup> t<sup>i</sup> tj]]]]
		- b. [<sup>α</sup> einen Brief gezeigt]<sup>i</sup> hat<sup>j</sup> [<sup>α</sup> Karl [<sup>α</sup> den Kindern [<sup>γ</sup> t<sup>i</sup> tj]]]
		- c. [<sup>α</sup> den Kindern einen Brief gezeigt]<sup>i</sup> hat<sup>j</sup> [<sup>α</sup> Karl [<sup>γ</sup> t<sup>i</sup> tj]]

Konstituenten wie γ in (20iia) werden z. B. für das Vorfeld von (21) benötigt:

(21) [<sup>α</sup> gezeigt haben] soll Karl den Kindern einen Brief

Dementsprechend ist es nicht klar, wie die Struktur eines E-Satzes wie (22) ist:

	- b. daß [Karl [den Kindern [einen Brief gezeigt]]] hat
	- c. daß [Karl [den Kindern [[einen Brief gezeigt] hat]]]

Alle Strukturen in (23) (und mehr) kommen in Frage, wenn man sich in erster Linie an der Vorfeldbesetzung orientiert.

Es ist keineswegs sicher, daß die strukturellen Ambiguitäten von (20i,ii) und (23) wirklich existieren. Im Ndl. hat man Fälle wie (24b):

9 Projektionsstufen bei V-Projektionen

	- b. [<sup>δ</sup> gelezen kunnen hebben] zou hij het boek

In einem entsprechenden E-Satz kann die Konstituente δ nicht realisiert werden:

	- b. ?\* dat hij het boek zou [<sup>δ</sup> gelezen kunnen hebben]

Das Pendant zu (24) ist vielmehr (26):

(26) dat hij het boek gelezen zou kunnen hebben

Es gibt also Fälle, wo eine Spur nicht durch ihr Antezedens ersetzt werden kann. Offenbar muß, wenn die Verben wie in (25) und (26) in der Endposition versammelt sind, ein 'Verbkomplex' gebildet werden (eine Konstituente mit ähnlichen Eigenschaften wie V<sup>e</sup> ). Im Ndl. sind dabei z. T. bestimmte Inversionen der Verben obligatorisch; deshalb ist (25) nicht möglich. Im Standarddeutschen gibt es derartige Inversionen nicht. Trotzdem könnte auch hier die Verbkomplexbildung obligatorisch sein. Falls sie es ist, scheiden Strukturen wie (23b,c) und (20i) aus. Insofern darf von der Annahme (16vi) nur eingeschränkt und mit Vorsicht Gebrauch gemacht werden.

**2.3** Die Annahme (16iii) lautet: Bei Bewegungen des klassischen Typs können nur maximale Projektionen (Xmax) involviert sein. Aber was sind maximale Projektionen?

Nach der klassischen Interpretation beinhaltet (16iii) vermutlich auf jeden Fall (27):

(27) Die Spur einer Bewegung des klassischen Typs kann nicht den Kopf einer Projektion bilden.

Die Vorfeldbesetzung im Deutschen erfüllt diese Bedingung in der Tat, wenn man die Strukturen (20ii) annimmt. Die Spur *t<sup>i</sup>* bildet dort jeweils nicht den Kopf einer Projektion; vielmehr werden die nicht gesättigten Teile des Thetarasters von *t<sup>i</sup>* durch Externalisierung (Funktionale Komposition) an γ weitergegeben, wobei γ eine Projektion von *t<sup>j</sup>* ist. In entsprechender Weise bildet *gezeigt* in der Struktur (23a) nicht den Kopf einer Projektion, sondern das Thetaraster von *gezeigt* geht durch Externalisierung an die erste Projektionsstufe von *hat* über. Für diese Überlegung ist es gleichgültig, welche Projektionsstufe man für *t<sup>i</sup>* bzw. für *gezeigt* annimmt.

In vielen älteren Untersuchungen herrscht die Annahme (28):

(28) Eine Konstituente von der Kategorie X<sup>j</sup> in Basisposition ist nur dann nicht Kopf einer Projektion, wenn j = 2 ist.

Wenn (28) richtig ist, müssen die Spuren *t<sup>i</sup>* von α und mithin auch α selbst in (20ii) V<sup>2</sup> sein, und damit ist kompatibel, daß die β in (18) ebenfalls V<sup>2</sup> sind. Aber die Forderung (28) ist ohne Berücksichtigung von Externalisierungsvorgängen aufgestellt worden, wie sie im Verbkomplex stattfinden, und allgemein ist die Frage, wie (28) begründet ist. Es gibt sofort Probleme, wenn man die gängige Annahme (29) hinzufügt:

(29) Eine Konstituente von der Kategorie X<sup>2</sup> (eine 'maximale Projektion') kann einen Spezifikator enthalten, d. h. eine Konstituente, die Tochter von X<sup>2</sup> und Schwester von X<sup>1</sup> ist.

Es ist nie gelungen, für die klassische VP des Englischen einen Spezifikator im Sinne von (29) zu identifizieren. (Eine Chance für einen Spezifikator hat man nur dann, wenn man die Basisposition des Subjekts in der V-Projektion lokalisiert. Ob dieser Spezifikator dann nützliche Dienste tut, ist offen.) Das ist einer der Gründe dafür, daß Fukui [= Fukui (1986)] (28) aufgegeben hat und Spezifikatoren (und damit Projektionen der Stufe 2) nur in gewissen besonderen Fällen annimmt. Dann kann man folgenden Wortgebrauch einführen:

	- ii. Eine Kategorie X<sup>j</sup> ist in der Sprache L<sup>i</sup> ein 'maximaler Projektionstyp' gdw. X<sup>j</sup> in L<sup>i</sup> niemals als Kopf einer Projektion X<sup>k</sup> mit k > j auftritt.

Den vermutlich intendierten vollen Gehalt von (16iii) kann man dann durch (31) verdeutlichen:

	- ii. Eine solche Spur muß zugleich von maximalem Projektionstyp im Sinne von (30ii) sein.

Auf diesem Hintergrund kann man ohne Probleme annehmen, daß im Deutschen V 1 ein maximaler Projektionstyp ist. In (1) ist dann i = 1; Regel (19) ist überflüssig. Die α in (17) und die β in (18) sind dann V<sup>1</sup> . Man beachte: Wenn man zusätzlich

9 Projektionsstufen bei V-Projektionen

zu einer rekursiven Strukturanweisung (32i) noch eine Strukturanweisung (32ii) einführen würde, würde (17) gegen (31ii) verstoßen.

(32) i. V <sup>1</sup> *→* X max V 1 , wobei Xmax Objekt oder Adverbial sein kann ii. V <sup>2</sup> *→* X max V 1 , wobei Xmax Subjekt ist

### **3 Noch einmal: V<sup>1</sup>** *→* **(Ymax) V<sup>e</sup>**

Frey und Tappe erörtern, daß infinite Verben nicht immer allein im Vorfeld stehen können:

	- b. wütend gemacht hat Paul die Kassiererin

Sie schlagen vor, *wütend* hier zu den Ymax von (2) zu rechnen. Da *gemacht* dann kein V<sup>1</sup> (und schon gar nicht ein V<sup>2</sup> ) darstellt, verstößt (33a) gegen F/Ts Annahme, daß das Vorfeld von einer X<sup>2</sup> -Konstituente gefüllt sein muß. Man sieht jedoch, daß diese Annahme überflüssig ist: Wenn *gemacht* eine Spur von der Kategorie V <sup>e</sup> bindet, verstößt (33a) auf jeden Fall gegen (31ii). (33b) dagegen ist voll kompatibel mit (31).

Tappe und Frey machen die weitere Annahme, daß die Ymax von (2) in dem Sinn 'ortsfest' sind, daß sie nicht 'gescrambelt' werden können. (Diese Annahme modifizieren sie auf S. 10f. etwas. Auf die dort diskutierten Daten gehe ich nicht ein.) Es ist nicht ganz deutlich, wie sie dieser empirischen Annahme formal Rechnung zu tragen gedenken. Man könnte folgendes Prinzip postulieren:

(34) Die Landeposition einer 'Scrambling-Bewegung' ist konfigurationell nicht unterscheidbar von der Ausgangsposition der Bewegung.

Nach dieser Annahme kann ein Xmax von (1) gescrambelt werden, da sein Landeplatz eine Adjunktion an V<sup>i</sup> sein müßte; sowohl die Ausgangsposition als auch die Landeposition ist dann nach F/T eine Tochter von V<sup>2</sup> . Wenn ein Ymax von (2) gescrambelt würde, wäre dagegen die Ausgangsposition eine Tochter von V<sup>1</sup> und die Landeposition eine Tochter von V<sup>2</sup> .

Möglicherweise – ganz klar ist das nicht – soll man die Äußerung (35) im Sinn von (34) verstehen:

(35) " Gleichzeitig verfügen diese Sprachen [sc. das Englische und die skandinavischen Sprachen] nicht über Grundpositionen des deutschen Typs (sind also keine *scrambling*-Sprachen)." (F/T 1991: 5f.)

Aus (34) ergibt sich ja, daß eine Sprache nur dann Scrambling haben kann, wenn sie über Grundpositionen gemäß (1) verfügt. Allerdings kann man die rekursiven V i -Strukturen in Übereinstimmung mit (34) durchaus als V<sup>1</sup> -Strukturen analysieren: Die Grundposition von Ymax ist nach (2) eine Schwester von V<sup>e</sup> ; die Landeposition bei Scrambling wäre eine Schwester von V<sup>1</sup> .

### **4 X 2 als abgeschlossene Kategorie**

Offenbar spricht nichts dafür, rekursive V<sup>2</sup> -Strukturen im Deutschen anzunehmen. Möglicherweise spricht etwas dagegen. SLF-Konjunkte wie α in (36a) sind prädikative Kategorien. α ist die erste Projektionsstufe einer funktionalen Kategorie, sagen wir α = I<sup>1</sup> . Durch Externalisierung erhält I<sup>1</sup> von Vmax ein Thetaraster mit einer ungesättigten Subjekts-Thetarolle und weist diese Thetarolle dem Subjekt *sie* zu.

	- b. wenn sie nach Hause kommt und [<sup>β</sup> da steht [<sup>V</sup> max der Gerichtsvollzieher vor der Tür]]
	- c. \* wenn sie nach Hause kommt und [<sup>β</sup> da sieht [<sup>V</sup> max den Gerichtsvollzieher]]

In der gleichen Position kann auch ein F2-Konjunkt stehen, wie in (36b); dabei sei β = I<sup>2</sup> . (36c) zeigt, daß ein solches I<sup>2</sup> nicht prädikativ sein kann. Diese Tatsache kann man durch verschiedene Stipulationen erfassen. Eine besonders einfache – d. h.: besonders generelle und damit starke – Annahme ist in (37) formuliert:

(37) X 2 -Kategorien sind in dem Sinn abgeschlossen, daß sie kein Thetaraster aufnehmen können.

Aus (37) folgt, daß β in (36c) im Unterschied zu α in (36a) kein Thetaraster aufnehmen, also auch keine Thetarolle zuweisen kann. Aus (37) folgt zugleich, daß in (36a) Vmax *̸*= V 2 sein muß, denn V<sup>2</sup> könnte kein Thetaraster aufnehmen, folglich auch keins an α weitergeben.

### **Literatur**

Frey, Werner & Hans-Thilo Tappe. 1991. *Zur Interpretation der X-bar-Theorie und zur Syntax des Mittelfeldes*. Manuskript 30. Januar 1991. [http://www.zas.gwzberlin.de/fileadmin/mitarbeiter/frey/SyntaxMF.pdf, 06.02.2018].


### **Chapter 10**

## **Über Verum-Fokus im Deutschen**

Tilman N. Höhle

### **1 Verum-Fokus<sup>∗</sup>**

Nehmen wir an, daß sich der Sprecher A an den Sprecher B wendet, indem er den Satz (1a) äußert. Sprecher B kann darauf mit (1b) antworten:

	- b. (das stimmt) Karl schreibt ein Drehbuch

(Kapitälchen stehen für Betonung.) Hier antwortet B in genau der Form (mit der Konstituentenbetonung), in der A den Gedanken, daß Karl ein Drehbuch schreibt, als neuen Beitrag in den Diskurs eingebracht hat. Insofern ist (1b) eigenartig. Aber solche Erwiderungen, die einen bereits bekannten Gedanken wie einen neuen präsentieren, sind eine durchaus übliche Redestrategie.

Auf die gleiche Äußerung (2a) könnte B auch mit (2b) reagieren:

<sup>∗</sup>Dieser Beitrag beruht auf Vorträgen im Anschluß an Höhle (1988) vor Mitgliedern des von der schwedischen Reichsbank unterstützten Forschungsprogramms 'Sprache und Pragmatik', denen ich für ihre kritische Anteilnahme danke. Besonderen Dank schulde ich Sven-Gunnar Andersson, Josef Bayer, Jorunn Hetland, Joachim Jacobs, Marga Reis und Inger Rosengren. Im Norwegischen und Schwedischen gibt es Beobachtungen zum Verum-Fokus, die aus der Sicht der hier besprochenen deutschen Daten überraschend sind. Vgl. dazu Hetland (1992).

Tilman N. Höhle. 2019. Über Verum-Fokus im Deutschen. In Stefan Müller, Marga Reis & Frank Richter (Hrsg.), *Beiträge zur deutschen Grammatik. Gesammelte Schriften von Tilman N. Höhle. Zweite durchgesehene Auflage*, 381–416. Berlin: Language Science Press. DOI:10.5281/zenodo.2588365

<sup>§</sup>*Anmerkung der Herausgeber:* Diese Arbeit wurde erstmals veröffentlicht in Joachim Jacobs (Hrsg.). 1992. *Informationsstruktur und Grammatik* (Linguistische Berichte. Sonderheft 4/1991– 1992), 112–141. Opladen: Westdeutscher Verlag. Editorische Eingriffe in den Wiederabdruck beschränken sich auf Anpassungen an das einheitliche Bandformat.

	- b. (das stimmt) Karl schreibt ein Drehbuch

Obwohl hier *schreibt* betont ist, soll in diesem Kontext offensichtlich nicht der lexikalische Inhalt des Verbs *schreib-* oder ein Inhaltsbestandteil der Flexionsform (etwa das Präsens) hervorgehoben werden. Was man hier intuitiv als hervorgehoben versteht, ist vielmehr die Bekundung, daß B den Gedanken, daß Karl ein Drehbuch schreibt, für wahr hält. Man kann den Effekt von (2b) etwa mit (3) umschreiben:

(3) es *trifft zu* / ist *wahr*, daß Karl ein Drehbuch schreibt

Dabei ist der inhaltlich hervorgehobene Teil kursiv ausgezeichnet. Eine Erwiderung mit einer solchen Fokus-Hintergrund-Struktur ist genau das, was man im Kontext (2a) erwartet; aber es ist eigenartig, daß die Betonung in (2b) diesen Effekt haben kann.

Noch auffälliger tritt dieser Effekt zutage, wenn das betonte finite Verb keinen lexikalischen Inhalt hat, sondern nur temporale Funktion hat wie in (4a) oder Bestandteil eines idiomatischen Komplexes ist wie in (5a) und (6a). Dabei ist in (b) jeweils ein geeigneter Kontext und in (c) eine Umschreibung des Effekts von (a) im Kontext (b) gegeben.

	- b. Karl hat bestimmt nicht gelogen
	- c. es ist *wahr*, daß Karl nicht gelogen hat
	- b. hörst du denn nie auf?
	- c. es ist *sicher*, daß ich mal aufhöre
	- b. ich kann mir nicht vorstellen, daß sie ihn wirklich umbringen will
	- c. es ist *wirklich so*, daß sie ihm den Garaus macht

Um den Inhalt der idiomatischen Verbindung *auf-hör-* hervorzuheben, müßte man den Verbzusatz *auf* betonen; um den Inhalt von *d- Garaus mach-* hervorzuheben, müßte man das Substantiv *Garaus* innerhalb des Objekts betonen.

Einen ähnlichen Effekt findet man bei uneingebetteten Interrogativsätzen, und zwar sowohl bei Entscheidungs-Interrogativen wie (7)–(9) als auch bei W-Interrogativen wie (10)–(12):

### 10 Über Verum-Fokus im Deutschen

	- b. ich habe Hanna gebeten, damit aufzuhören
	- c. ist es denn *wahr*, daß sie damit aufhört?
	- b. es heißt, daß Karl den Hund getreten hat
	- c. ist es denn *wahr*, daß er den Hund getreten hat?
	- b. ich habe Karl gedroht, daß ich ihm die Leviten lesen werde
	- c. ist es *wahr*, daß Sie ihm die Leviten lesen?
	- b. ich habe Hanna gebeten, damit aufzuhören
	- c. für welche *x* ist es denn *zutreffend*, daß sie zum Zeitpunkt *x* damit aufhört?
	- b. ich habe den Hund nicht getreten, und Karl hat es auch nicht getan
	- c. für welches *x* ist es denn *zutreffend*, daß die Person *x* den Hund getreten hat?
	- b. daß Karl nicht teilnimmt, hat nichts mit seiner Kurzsichtigkeit zu tun
	- c. für welches *x* ist es denn *zutreffend*, daß er wegen *x* nicht teilnimmt?

Genau wie bei den Deklarativen in (2b) und (4a)–(6a) ist der in (7a)–(9a) ausgedrückte Gedanke aus dem Kontext bekannt; hervorgehoben ist die Bekundung, daß der Sprecher über die Wahrheit dieses Gedankens Auskunft verlangt. In (10a)–(12a) ist der ausgedrückte Gedanke bis auf die Belegung der Variablen *x* bekannt, und hervorgehoben ist, daß die korrekte Belegung dieser Variablen gesucht ist.

In allen diesen Fällen kann man den Effekt, den die Betonung des Verbs hat, einigermaßen plausibel umschreiben, indem man ein Prädikat 'wahr' (oder ein Synonym) einführt und als inhaltlich hervorgehoben betrachtet. Ich nenne diesen hervorgehobenen Bedeutungsanteil VERUM und bezeichne solche Fälle als Verum-Fokus.<sup>1</sup>

<sup>1</sup> Einige Autoren bezeichnen solche Fälle (bzw. ihre Entsprechung in anderen Sprachen) als 'polar focus' oder 'polarity focus'; z. B. Dik et al. (1980) und Gussenhoven (1984). Ich benutze diesen Ausdruck nicht, da ich den Begriff der 'Polarität' für ein dubioses Konzept halte.

### **2 Semantischer und nicht-semantischer Fokus**

In den später folgenden Abschnitten gehe ich davon aus, daß es sich beim Verum-Fokus um einen 'semantischen Fokus' im Sinne von Expl. (= Höhle (1982)): 87f. handelt [= S.122f. in diesem Bd.]. Ich will also die Annahme (13) machen:

(13) In den betrachteten Fällen ist dem Verb ein Bedeutungselement VERUM zugeordnet, so daß dieses Element durch die Betonung des Verbs hervorgehoben wird.

Diese Annahme ist nicht selbstverständlich. Zweifellos ist es häufig so, daß ein betontes Wort als semantischer Fokus fungiert. Es gibt jedoch mehrere Falltypen, bei denen das nicht so ist.

### **2.1** *W***-Fokus**

Es gibt Fälle, in denen die Betonung eines Worts die phonetische Gestalt des Worts hervorheben soll und nicht irgendeinen Bedeutungsbestandteil, der mit dem Wort assoziiert ist. Wenn A und B gemeinsam ein Fahrrad betrachten, kann A (14) äußern, auch dann, wenn A weiß, daß B den Gegenstand als Fahrrad identifiziert:

(14) das ist ein Velo

So kann man die Bedeutung der Lautgestalt *Velo* klarmachen. Die Funktion der Betonung, die Lautgestalt des betonten Ausdrucks hervorzuheben, ist ein Fall von '*W*-Fokus' im Sinne von Expl.: 87f. [= S.122f. in diesem Bd.].

### **2.2 Fokusprojektion**

Ein interessanter Falltyp ist in (15a) zu sehen:

	- b. du siehst so fröhlich aus; was ist denn los?

Wenn der Satz als Erwiderung zu (15b) geäußert wird, soll mit großer Wahrscheinlichkeit nicht hervorgehoben werden, daß es der Chef war, der geohrfeigt wurde, sondern daß der Chef vom Sprecher einer Züchtigung unterworfen wurde. Das heißt, daß mindestens der Inhalt von *habe meinen Chef geohrfeigt* hervorgehoben ist, also wesentlich mehr, als dem Inhalt des betonten Worts entspricht. In (15a) liegt ein nicht-minimaler Fokus vor, der auf 'Fokusprojektion' zurückgeht, indem der 'Fokusexponent' betont ist; vgl. Expl.: 98f. [= S.136f. in diesem Bd.].

### 10 Über Verum-Fokus im Deutschen

Seit Beginn aller Beschäftigung mit den Funktionen der Betonung ist es offensichtlich, daß mit einer Hervorhebung normalerweise eine implizite Gegensatzbildung – d. h. ein Bezug zu möglichen Alternativen – verbunden ist. Bei einem Fall wie (16) haben wir jedoch keinen minimalen Fokus, der einen Alternativenbezug zuließe:

(16) er hat nur die Nase gerümpft

Das Verb *rümpf-* ist obligatorisch mit *Nase* verbunden; bei (16) kann also nicht die Nase im Gegensatz zu irgendwelchen anderen Dingen stehen. Tatsächlich wird man (16) normalerweise als einen Fall von Fokusprojektion verstehen, mit dem Objekt *die Nase* als Fokusexponent.

Ähnliche Beobachtungen kann man bei idiomatischen Komplexen machen. Bei transitiven Verben fungiert im Allgemeinen ein Objekt als Fokusexponent, wie z. B. in (15a) und (16). Genau das Gleiche gilt in (17).

	- b. sie will uns die Leviten lesen

Die Wörter *Garaus* und *Leviten* haben keine aufweisbare Bedeutung; durch ihre Betonung kann kein minimaler semantischer Fokus etabliert werden. Der kleinste mögliche semantische Fokus ist hier die Verbindung von Objekt und Verb. Ebenso ist es bei Verbindungen von Verb und Verbzusatz. In Fällen wie (18) fungiert der Verbzusatz als Fokusexponent für die ganze Verbindung:

	- b. ich will das mal aufklappen

Die bedeutungsleeren Verbzusätze *ein* und *auf* in (19) fungieren genauso:

	- b. du mußt damit aufhören

Aufgrund der Fokusprojektion gibt es hier einen möglichen semantischen Fokus, der aus Verb und Verbzusatz besteht; dabei kommt es offensichtlich nicht darauf an, ob der betonte Fokusexponent selber einen (minimalen) semantischen Fokus bilden kann.<sup>2</sup>

### **2.3 Differenz-Fokus**

Einen bemerkenswerten anderen Falltyp von nicht-semantischem Fokus stellen Beispiele wie (20a) und (21a) dar:

<sup>2</sup>Wenn ich es recht verstehe, sind die Ideen von 'communicative dynamism' und 'transition', die in der sog. 'neuen Prager Schule' der sechziger und siebziger Jahre vertreten wurden, nicht kompatibel mit diesem Faktum.

	- b. Karl hat Schnupfen
	- b. Karl ist vermutlich krank

Wenn (a) als Erwiderung zu (b) gebraucht wird, soll inhaltlich offensichtlich das Vergangenheitstempus hervorgehoben werden. Das Tempus (Perfekt) ist in erster Linie durch das Perfekthilfsverb (in (20a): *hab-*; in (21a): *sei-*) ausgedrückt; in (a) ist aber jeweils nicht das (finite) Perfekthilfsverb, sondern das infinite 'Hauptverb' betont. Wie ist es möglich, daß durch diese Betonung das Perfekt hervorgehoben wird?

Man könnte mutmaßen, daß das Perfekt doch in erster Linie durch das Partizip ausgedrückt wird. Diese Annahme ist aber ganz unplausibel, denn das Partizip ist z. B. auch an der Bildung des Passivs beteiligt, und dort hat es keinerlei Vergangenheitswert. Zudem gibt es beim Perfekt unter bestimmten Bedingungen den sog. Ersatzinfinitiv, wie in (22):

### (22) Karl hat mich schnarchen hören

Statt des erwarteten Partizips *gehört* ist hier der Infinitiv *hören* möglich. Also kann es nicht sein, daß das Perfekt wesentlich durch das Partizip zum Ausdruck kommt.<sup>3</sup> Vermutlich muß man (20a) und (21a) so deuten, daß dort das Wort betont wird, in dessen Anwesenheit sich der wesentliche lautliche Unterschied zum Kontext (20b) bzw. (21b) manifestiert.

Diese Vermutung bestätigt sich in Beispielen wie (23a), die nichts mit dem Perfekt zu tun haben:

	- b. Karl wird wohl grade gefoltert

Durch die Betonung von (23a) wird im Kontext (23b) das Futur hervorgehoben, obwohl das betonte *werden* ein Passivhilfsverb ist und nicht das 'Futur-Hilfsverb'. Ein Beispieltyp, der gar nichts mit Tempus zu tun hat, ist in (24a) zu sehen:

<sup>3</sup>Die Verbform, die in diesen Konstruktionen für das Partizip eintritt, sieht in der Regel genau wie der normale Infinitiv aus. Von dieser Regel gibt es jedoch eine Ausnahme. Im Niederländischen ist der Gebrauch des Ersatzinfinitivs erheblich weniger eingeschränkt als im Deutschen; z. B. kommt er auch mit dem Perfekthilfsverb *zij-* vor (im Deutschen nur mit *hab-*). Beim Perfekt der Kopula *zij-* tritt dann aber nicht der normale Infinitiv *zijn* für das Partizip *geweest* ein, sondern eine ansonsten ungebräuchliche Form *wezen*. Möglicherweise darf man den Ersatzinfinitiv also nicht einfach mit dem morphologischen Infinitiv identifizieren. Trotzdem bleibt die Überlegung richtig, daß das Perfekt nicht in erster Linie durch das Partizip gekennzeichnet ist.

10 Über Verum-Fokus im Deutschen

### (24) a. ein Soldat hat Mut zu haben

b. ein Soldat hat Mut

In (a) wird wiederum dasselbe 'Hauptverb' *hab-* betont, das schon in (b) vorkommt, aber hervorgehoben ist das 'modale' *hab-*, das sich mit einem *zu*-Infinitiv verbindet – offensichtlich, weil die Anwesenheit dieses *zu haben* den wesentlichen lautlichen Unterschied zum Kontext ausmacht. Daß der semantische Unterschied zum Kontext gar nicht in diesem lautlichen Unterschied lokalisiert ist, spielt in diesen Fällen offensichtlich keine Rolle.

Ich will das hier illustrierte Phänomen als Differenz-Fokus bezeichnen. Beim Differenz-Fokus wird also in einem Satz α ein Ausdruck *m* betont, durch den α sich lautlich von einem Vorgängersatz β unterscheidet (der Wortbestand von α ohne *m* ist also gleich dem Bestand von β), unabhängig davon, ob der betonte Ausdruck eine inhaltliche Entsprechung in β hat. Inhaltlich ist in α auf jeden Fall der logische Unterschied zwischen α und β (der durch die Anwesenheit von *m* in α erkennbar ist) hervorgehoben. Es ist auffällig, daß Beispiele wie (20a) usw. in ihrem Kontext unangemessen wirken, wenn man den Differenz-Fokus durch die eigentlich erwartete Betonung mit semantischem Fokus ersetzt, wie in (25):


(Dabei weist das Doppelkreuz # auf kontextuelle Unangemessenheit unter der intendierten Lesart hin; von der Möglichkeit, (25) eventuell als Verum-Fokus zu interpretieren, sehe ich hier ab.) In solchen Fällen, wo semantischer Fokus und Differenz-Fokus die gleichen Hervorhebungseffekte haben, aber zu verschiedenen Konstituentenbetonungen führen, hat offenbar der Differenz-Fokus Vorrang.

### **2.4 Exklamativ-Fokus**

Bei uneingebetteten exklamativen Äußerungen kann man Betonungen wie in (26) finden:

(26) a. bist du aber braun!

b. hat der aber große Füße!

Wie zuerst Hans Altmann bemerkt hat, scheint es nicht möglich zu sein, den Effekt dieser Betonung auf einen der bekannten Fokustypen zurückzuführen (vgl.

Expl.: 145, Anm. 12b) [= S.126, Anm.14 in diesem Bd.]. In den Kontexten, in denen Sätze wie (26) typischerweise geäußert werden, geht es schwerlich darum, den Inhalt des Worts *du* bzw. *der* besonders hervorzuheben (viel eher wird der Inhalt von *braun* bzw. *große Füße* als hervorgehoben empfunden). Es ist auch nicht zu sehen, welches Bedeutungselement etwa mit der Subjektfunktion von *du* und *der* oder mit der Position dieser Subjekte verbunden sein könnte, so daß die Betonung des Subjekts dieses Inhaltselement hervorheben würde. Es hat tatsächlich den Anschein, daß in exklamativen Äußerungstypen z. T. völlig eigene Regeln für die Lage und den Effekt von Betonungen gelten. Zu den speziellen Exklamativphänomenen rechne ich auch Fälle wie (27):

	- b. der hat aber große Füße!

Vom Verum-Fokus unterscheiden sich solche Fälle (abgesehen von ihrem emphatisch-exklamativen Charakter) besonders dadurch, daß der in ihnen enthaltene Gedanke (daß dieser Kerl sich angestrengt hat bzw. große Füße hat) durchaus nicht als bekannt vorausgesetzt wird; dies scheint aber ein Kennzeichen des Verum-Fokus zu sein.

### **2.5 Verum-Fokus als semantischer Fokus**

Wenn man auf die Beispiele mit Verum-Fokus in Abschnitt 1 zurückblickt, sieht man leicht, daß der Verum-Fokus auf keinen Fall als *W*-Fokus oder Differenz-Fokus gedeutet werden kann, denn beim Verum-Fokus ist die Lautgestalt des betonten Ausdrucks häufig aus dem Kontext bekannt. Mit Fokusprojektionen hat der Verum-Fokus anscheinend nichts Wesentliches zu tun. Wenn man den Verum-Fokus als Sonderfall des Exklamativ-Fokus deuten wollte, könnte man diese Deutung allenfalls dadurch stützen, daß der Exklamativ-Fokus theoretisch völlig unverstanden ist; also kann man nicht mit Sicherheit ausschließen, daß die Verum-Fokus-Phänomene aus einer adäquaten Theorie des Exklamativ-Fokus deduktiv folgen würden. Es gibt auch über den Exklamativ-Fokus hinaus unverstandene Fokusphänomene, unter die der Verum-Fokus als ein Sonderfall gehören könnte. Das Verständnis des Verum-Fokus wird aber wenig gefördert, solange man nichts anderes tut, als ihn dem Bereich des Rätselhaften zuzuordnen. Die folgenden Abschnitte machen einige Konsequenzen deutlich, die sich aus der Annahme (13) ergeben.

10 Über Verum-Fokus im Deutschen

### **3 IT-Deutung von VERUM**

### **3.1 VERUM als Illokutionstyp-Operator**

Es stellt sich die Frage, was für ein Bedeutungselement VERUM ist und ob es unabhängige Gründe gibt, ein solches Element zu postulieren. Da im allgemeinen gilt, daß p *⇔* WAHR (p), ist die Einführung eines abstrakten VERUM-Elements völlig ad hoc, solange es einzig durch die Verum-Fokus-Phänomene begründet ist. In Expl.: 89f. und 145, Anm. 12b [= S.124f. und 126f., Anm.14 in diesem Bd.] ist der Vorschlag gemacht, daß das finite Verb in Konstruktionen wie (1)–(12) – nämlich in nicht-eingebetteten Sätzen mit Anfangsstellung des finiten Verbs – einem Operator *T* (in Aussagesätzen, entsprechend Freges Urteilsstrich) bzw. *?* (in Fragesätzen) zugeordnet ist, der durch die Betonung des Verbs inhaltlich hervorgehoben werden kann. Nach diesem Vorschlag ist VERUM also (nicht ein Wahrheitsprädikat, sondern) ein Illokutionstyp-Operator (genauer: eine Variable über solche Operatoren). Diese Idee trägt den Intuitionen über den Effekt des Verum-Fokus plausibel Rechnung und hat den Vorzug, daß derartige Bedeutungselemente durch völlig unabhängige Erwägungen begründet sind. Ich will sie als die IT-Deutung von VERUM bezeichnen.

### **3.2 Direkte W-Interrogative**

Im Zusammenhang mit einer weiteren Annahme ergibt sich aus der IT-Deutung jedoch eine empirische Unstimmigkeit. Nach Expl.: 144, Anm. 12a [= S.125, Anm.13 in diesem Bd.] sind einem Interrogativpronomen im Vorfeld wie dem *wer* in (28) (= (11a)) jeweils zwei formale Elemente zugeordnet: eine freie Variable und der Operator *?*:

(28) wer hat den Hund denn getreten?

Demnach ist *?* sowohl dem *wer* als auch dem *hat* zugeordnet. Die Betonung von *wer* sollte deshalb den gleichen Effekt haben können wie die Betonung in (28). Aber (29) hat völlig andere Effekte als (28):

(29) wer hat den Hund denn getreten?

(Bei dieser Betonung scheint außerdem das *denn* zu stören: Das Beispiel ist gar nicht voll akzeptabel.)

Es ist schwer zu beurteilen, ob diese falsche Prädiktion zu vermeiden ist, ohne daß zugleich die IT-Deutung aufgegeben wird. Die Annahme, daß bei uneingebetteten W-Interrogativsätzen sowohl das finite Verb in Anfangsposition als auch das W-Pronomen dem Operator *?* zugeordnet ist, ist insofern naheliegend, als nur beide zusammen einen direkten W-Interrogativsatz ausmachen. Wenn das Verb

die Endposition innehat, wie in (30a), erhalten wir keinen Interrogativsatz mit den Eigenschaften einer W-Frage; und wenn das W-Pronomen nicht im Vorfeld steht, wie in (30b), erhalten wir zwar eine W-Frage, aber keinen Interrogativsatz.

	- b. es hat wer (\*denn) den Hund getreten?

(Wie 'Echofragen' wie (30b) formal zu behandeln sind und wie insbesondere ihre Differenz zu direkten W-Interrogativen darzustellen ist, ist nur in Ansätzen klar. Zur Diskussion der Unterschiede vgl. Reis (1991) und dort genannte Literatur.) Fälle wie (29) müssen als potentiell ernstes Problem angesehen werden. Ich möchte diese Frage aber vorläufig beiseite stellen und einige andere Beispieltypen mit betontem finiten Verb betrachten.

### **4 Weitere Beispieltypen**

### **4.1 Imperative**

In Imperativsätzen wirken im Allgemeinen dieselben Fokusregeln wie in anderen Sätzen. So findet man z. B. ganz so, wie man es erwartet, bei Imperativen die Konstituentenbetonungen von (31):

	- b. nun hör doch damit auf
	- c. lies ihm mal die Leviten

Man findet jedoch auch das Verb betont:

	- b. nun hör doch damit auf
	- c. lies ihm mal die Leviten

Im Vergleich zu (31) wirken diese Beispiele emphatischer und nachdrücklicher. Insofern haben sie Ähnlichkeit mit dem Exklamativ-Fokus. Zugleich scheinen sie aber den Charakter der ungeduldigen Ermahnungen zu haben, als ob die gleiche Aufforderung schon mehrfach ausgesprochen worden wäre, als ob ihr Inhalt also als bekannt vorausgesetzt würde. Insofern kann man sie wie in (33) umschreiben, wobei der inhaltlich hervorgehobene Bestandteil kursiviert ist:

	- b. nun mach es doch *wahr*, daß du damit aufhörst
	- c. mach es mal *wahr*, daß du ihm die Leviten liest

10 Über Verum-Fokus im Deutschen

Es ist insofern naheliegend, Fälle wie (32) zum Verum-Fokus zu rechnen. Wenn man für Imperative plausiblerweise einen eigenen Operator *!* annimmt, dem das finite Verb zugeordnet ist, sind solche Fälle von Verum-Fokus nach der IT-Deutung von VERUM auch zu erwarten.

### **4.2 Wunschsätze**

Es gibt einen Typ von Wunschsätzen im Konjunktiv Präteritum, bei dem Verberststellung wie auch Einleitung mit *wenn* möglich ist:

	- b. hörte sie doch damit auf!

Bei Verberststellung kann auch das Verb betont sein:

	- b. nähme sie sich doch einen Stuhl!
	- c. läse sie ihm doch die Leviten!

Der Effekt scheint ähnlich wie bei den Imperativen in (32) zu sein, indem der Inhalt der Sätze als bekannt vorausgesetzt wird. Die Umschreibungen in (36) scheinen insofern angemessen zu sein:

	- b. wenn es doch *wahr* wäre, daß sie sich einen Stuhl nimmt!
	- c. wenn es doch *wahr* wäre, daß sie ihm die Leviten liest!

Es liegt deshalb nahe, auch die Betonung in (35) als Verum-Fokus aufzufassen. Und wenn man für diesen Satztyp einen Illokutionstyp-Operator *KPW* annimmt, dem das Verb bei Erststellung zugeordnet ist, ist das nach der IT-Deutung wiederum zu erwarten.

Man mag erwägen, daß es vermutlich eine relevante Beziehung zwischen dem Verb in Erststellung und dem *wenn* von (34a) gibt. Da (34a) und (34b) ungefähr die gleiche Bedeutung haben, sollte dieses *wenn* ebenfalls dem Operator *KPW* zugeordnet sein (jedenfalls ist das kein konditionales *wenn*), und dann sollte die Betonung von *wenn* wie in (37) die gleichen Effekte wie (35) haben:

	- b. ? wenn sie sich doch einen Stuhl nähme!
	- c. ? wenn sie ihm doch die Leviten läse!

Mir erscheinen diese Beispiel bestenfalls zweifelhaft; jedenfalls deutlich schlechter als (35). Unter der IT-Deutung ist das unerwartet. Allerdings sehe ich auch bei alternativen Deutungen von VERUM keine offensichtliche Erklärung für die mindere Akzeptabilität von (37).

### **4.3 Konditionalsätze**

Auch bei gewissen Konditionalsätzen gibt es Verberststellung, und auch dort findet man die gleichen Betonungsmöglichkeiten wie bei (31) und (32):

	- b. hört sie damit auf, (so) können wir endlich fortfahren
	- c. liest sie ihm die Leviten, (so) können wir endlich fortfahren
	- b. hört sie damit auf, (so) können wir endlich fortfahren
	- c. liest sie ihm die Leviten, (so) können wir endlich fortfahren

Es scheint zunächst, daß man die Effekte von (39) auf zweifache Weise umschreiben kann, nämlich durch Paraphrase mit einem hervorgehobenen VERUM-Prädikat und durch Paraphrase mit einem hervorgehobenen *wenn*:

	- b. wenn es *wahr* ist, daß sie damit aufhört, (so) …
	- c. wenn es *wahr* ist, daß sie ihm die Leviten liest, (so) …
	- b. *wenn* (es wahr ist, daß) sie damit aufhört, (so) …
	- c. *wenn* (es wahr ist, daß) sie ihm die Leviten liest, (so) …

Wenn die IT-Deutung von VERUM richtig ist, kann (40) jedoch nicht wirklich angemessen sein, denn ein Illokutionstyp-Operator sollte nicht in irgendeiner Weise eingebettet sein, insbesondere nicht in einen Konditionalsatz.<sup>4</sup> Umgekehrt ist (41) unmittelbar plausibel: Da die Verberststellung in (38) und (39) einen Konditionalsatz kennzeichnet, könnte das finite Verb dort ebenso wie das *wenn* in (42) einem Bedeutungselement WENN zugeordnet sein, durch das sich Konditionalsätze auszeichnen. Dann sollte sowohl die Betonung des Verbs in (39) als auch die Betonung des *wenn* in (42) zur inhaltlichen Hervorhebung von WENN führen, wie sie in (41) angedeutet ist.

	- b. wenn sie damit aufhört, (so) können wir endlich fortfahren
	- c. wenn sie ihm die Leviten liest, (so) können wir endlich fortfahren

Beziehen wir Konditionalsätze mit konzessivem Charakter wie in (43) in die Betrachtung ein:

<sup>4</sup>Ausnahmen von diesem Grundsatz erwartet man bei Zitaten und eventuell ähnlichen Sonderfällen, aber nicht bei normaler Einbettung.

10 Über Verum-Fokus im Deutschen

	- b. hört sie auch damit auf, so können wir …

Bis auf den konzessiven Charakter, der (auf irgendeine Weise) von dem *auch* im Mittelfeld induziert wird, scheinen hier die gleichen Verhältnisse wie bei den nicht-konzessiven Konditionalen vorzuliegen. Allerdings ist hier die Betonung des Verbs in Anfangsstellung wie auch die des *wenn* ausgesprochen schlecht:

	- b. \* hört sie auch damit auf, so können wir …

Es ist völlig unklar, woran das liegen könnte. Aber die Parallelität zwischen (a) und (b) spricht dafür, daß in (44) sowohl *wenn* als auch *hört* einem WENN zugeordnet ist, und dieses WENN kann hier nicht hervorgehoben werden. Da in (39) und (42) vermutlich die gleichen strukturellen Verhältnisse vorliegen, dürfte auch in (39) das Verb einem (durch semantischen Fokus hervorgehobenen) WENN zugeordnet sein.

Soweit erscheint die Deutung von (39) befriedigend. Trotzdem gibt es eine Schwierigkeit. Es scheint, daß Sätze wie (42) nur dann kontextuell angemessen geäußert werden können, wenn ihr gesamter Inhalt aus dem Kontext bekannt ist; d. h., das konditionale Bedeutungselement WENN ist das einzige, was bei diesem Typ hervorgehoben sein kann. Diese Beschränkung gilt für Sätze wie (39) nicht. Es ist bei diesem Typ nicht nur möglich, sondern völlig typisch, daß die Apodosis einen neuen Gedanken enthält. Wenn man (40) als angemessene Umschreibung von (39) betrachtet, ist das auch leicht verständlich. Dann hat man innerhalb des eingebetteten (Konditional-)Satzes eine Hervorhebung, und nichts spricht dagegen, im Matrixsatz eine weitere Hervorhebung zu haben. Bei (41) dagegen ist das Element hervorgehoben, das den Gedanken des Konditionalsatzes (die Protasis) und den Gedanken des Matrixsatzes (die Apodosis) miteinander verknüpft, und es ist naheliegend, daß diese völlig andere Fokus-Hintergrund-Struktur die Möglichkeiten für zusätzliche Hervorhebungen scharf begrenzt.

Wenn diese Beobachtungen und Deutungsversuche korrekt sind, muß die IT-Deutung von VERUM unkorrekt sein, da (39) einen eingebetteten Verum-Fokus enthält. Allerdings ist es so, daß die konditionalen Verberstsätze schon rein syntaktisch einige Rätsel aufgeben;<sup>5</sup> man kann daher zögern, sie als Basis für theoretische Neuerungen bei der Deutung des Verum-Fokus zu benutzen. Im folgenden Abschnitt betrachten wir zweifelsfreie Fälle von eingebettetem Verum-Fokus.

<sup>5</sup> Im Unterschied zu *wenn*-Sätzen können sie z. B. nicht im Skopus einer korrelativen Koordinationspartikel (etwa *sowohl*, *weder*) oder einer Gradpartikel (etwa *nur*, *sogar*, *nicht*) stehen, und auf sie kann nicht durch ein kataphorisches *dann* verwiesen werden.

### **5 Einbettung**

### **5.1 Verbzweitsätze**

Zu Beginn haben wir Fälle von Verum-Fokus bei uneingebetteten Verbzweitsätzen betrachtet. Solche Sätze kommen auch eingebettet vor:

	- b. wenn Hanna meint, Karl schreibt ein Drehbuch, (dann …)

Die Gebrauchsbedingungen für (45b) entsprechen denen bei Nicht-Einbettung; man kann das durch (46) umschreiben:

(46) wenn Hanna meint, daß es *wahr* ist, daß Karl ein Drehbuch schreibt, (dann …)

Ganz entsprechend in (47):

	- b. jemand, der denkt, sie liest uns die Leviten, kann sie nicht sehr gut kennen

Ohne Zweifel enthalten die eingebetteten Verbzweitsätze einen Verum-Fokus. Wenn man die IT-Deutung aufrecht erhalten will, muß man annehmen, daß diese eingebetteten Sätze jeweils einen Illokutionstyp-Operator enthalten. Das wäre plausibel, wenn es sich um Zitate ('wörtliche Rede') handeln würde; dem ist aber nicht so. Wenn diese eingebetteten Sätze einen (für die Deutung vom VERUM relevanten) Operator enthalten, kann das kein Illokutionstyp-Operator im üblichen Sinne sein, denn im üblichen Verständnis kommt nur solchen syntaktischen Einheiten ein Illokutionstyp-Operator zu, denen (bei gegebener syntaktischer Gesamtstruktur) ein Äußerungsakt entsprechen kann. Damit ist aber zugleich der wesentliche Vorzug der IT-Deutung verloren: daß VERUM als ein unabhängig begründetes Bedeutungselement identifiziert ist.

### **5.2 C-Verum-Fokus**

Bisher haben wir Fälle betrachtet, in denen ein Verum-Fokus bei betontem finiten Verb vorlag. Diese Fälle seien unter der Bezeichnung " F-Verum-Fokus" zusammengefaßt. Es ist seit langem bekannt (wenn auch anscheinend kaum in publizierter Literatur diskutiert), daß es ähnliche Erscheinungen bei subordinierenden Partikeln wie *daß* und *ob* gibt:

10 Über Verum-Fokus im Deutschen

	- b. ich weiß nicht, ob sie in Rom war (aber wenn das der Fall ist, muß es vor kurzer Zeit gewesen sein)
	- c. weißt du, ob Hanna kürzlich in Rom war?

Wenn (a) oder (b) als Antwort auf (c) geäußert wird, kann die betonte Partikel nicht im Kontrast zu einer anderen Satzeinleitung stehen. Der Effekt dieser Betonung kann ähnlich wie beim F-Verum-Fokus umschrieben werden:

	- b. ich weiß nicht, ob es *der Fall* ist, daß sie in Rom war

Fälle wie (48a,b) will ich als C-Verum-Fokus bezeichnen. Die enge Verwandtschaft zum F-Verum-Fokus wird in (50) besonders deutlich:

	- b. (ja) ich denke, daß er damit aufhört
	- c. vielleicht hört Karl damit auf

Als Erwiderung zu (c) haben (a) und (b) etwa gleiche Effekte; insbesondere ist in beiden Fällen hervorgehoben, daß (der Sprecher denkt, daß) der Gedanke, daß Karl damit aufhört, wahr ist. Die gleichen Verhältnisse liegen in (51) vor:

	- b. aber Hanna meint, er hat gelogen
	- c. Karl hat bestimmt nicht gelogen

Auch zu (48a) gibt es eine Variante mit Verbzweitstellung:

	- b. weißt du, ob Hanna kürzlich in Rom war?

In (48a) wie in (52a) ist es im angegebenen Kontext kaum möglich, die in Klammern stehende Fortsetzung (*aber ob das kürzlich war …*) wegzulassen. Das kann man aufgrund konversationeller Prinzipien verstehen. Mit der Äußerung (a) nimmt der Sprecher zunächst zu einem echten Teil der Frage seines Gesprächspartners Stellung: Er drückt aus, daß er es für wahr hält, daß Hanna (irgendwann) in Rom war. Gefragt war aber, ob Hanna kürzlich in Rom war. Wenn der Sprecher sich nicht auch ausdrücklich zum Zeitpunkt des Romaufenthalts äußern würde, wäre seine Antwort nicht im erwartbaren Maße vollständig.

Gelegentlich hat es den Anschein, daß bei einem C-Verum-Fokus eine solche Fortsetzung erwartet wird, obwohl sie beim entsprechenden F-Verum-Fokus nicht erwartet wird. Bei der Frage (53c) z. B. ist die Antwort (53a) vollständig. Die Antwort (53b) dagegen scheint nicht völlig befriedigend; sie scheint nach einer Vervollständigung wie (53d) zu verlangen:

	- b. ich denke, daß er ihr zuhört
	- c. hört er ihr denn überhaupt zu?
	- d. aber ob er sie versteht, ist eine andere Frage

Falls dieser Eindruck korrekt ist, ist es ganz unklar, worauf dieses Fortsetzungsbedürfnis beim C-Verum-Fokus zurückzuführen ist. Sehr stark ausgeprägt ist es nicht. In dem nur geringfügig variierten Fall (54) empfinde ich (b) als ebenso vollständig wie (a):

	- b. sie denkt (jedenfalls), daß er ihr zuhört
	- c. hört er ihr denn überhaupt zu?

Wenn man unterstellt, daß die – nicht sehr deutlich etablierte – unterschiedliche Fortsetzungsbedürftigkeit keinen wesentlichen Unterschied konstituiert, spricht nichts dagegen, beim C-Verum-Fokus wie beim F-Verum-Fokus zu verfahren, d. h. die Partikeln *daß* und *ob* einem Inhaltsbestandteil VERUM zuzuordnen, der durch die Betonung der Partikel hervorgehoben wird. Dieses VERUM kann natürlich nicht gemäß der IT-Deutung verstanden werden, aus denselben Gründen wie in Abschnitt 5.1.

### **6 Skopus**

### **6.1 F-Verum-Fokus**

An (55) zeigt sich ein auffälliger Unterschied zwischen F- und C-Verum-Fokus:

	- b. # aber Hanna denkt, daß er ihr nicht zuhört
	- c. ich hoffe, daß Karl ihr zuhört

Als Erwiderung zu (c) ist (b) unangemessen, weil der im *daß*-Satz ausgedrückte Gedanke nicht aus (c) bekannt ist. Die Erwiderung (a) ist dagegen kontextuell angemessen. Das heißt, daß in (a) die Negation nicht als Teil des kontextuell 10 Über Verum-Fokus im Deutschen

gegebenen Gedankens interpretiert werden muß; sie gehört hier zum hervorgehobenen Teil, wie aus den Umschreibungen in (56) deutlich wird:

	- b. Hanna denkt, daß es *zutrifft*, daß er ihr nicht zuhört

Beim F-Verum-Fokus in (a) liegt das Verum-Element also im Skopus der Negation; beim C-Verum-Fokus in (b) ist das nicht möglich.

Weitere Beispiele mit VERUM im Skopus der Negation finden sich in (57a)– (59a):

	- b. es heißt, daß Karl ein Drehbuch geschrieben hat
	- c. aber es *trifft nicht zu*, daß Karl ein Drehbuch geschrieben hat
	- b. Hanna macht dir bestimmt den Garaus
	- c. es ist *nicht der Fall*, daß sie mir den Garaus macht
	- b. Karl hat die lächerliche Behauptung aufgestellt, daß sie damit aufhört
	- c. *trifft* es denn *nicht zu*, daß sie damit aufhört?

Daß VERUM im Skopus eines logisch relevanten Satzbestandteils liegt, ist natürlich nicht mit der IT-Deutung von VERUM vereinbar, denn ein Illokutionstyp-Operator hat seinem Begriff nach immer Skopus über sämtliche Satzbestandteile. VERUM muß formal offenbar wie ein Wahrheitsprädikat dargestellt werden. Unter dieser Voraussetzung ergibt sich der Skopusunterschied zwischen F-Verum-Fokus wie in (55a) sowie (57a)–(59a) und C-Verum-Fokus wie in (55b) deduktiv aus unabhängig begründeten Annahmen.

Für unsere Zwecke kann man den Zusammenhang zwischen der syntaktischen Form eines Ausdrucks α und möglichen Skopusverhältnissen in α abstrakt wie in (60) formulieren; der dabei gebrauchte Ausdruck " *B (Ki)*" ist in (61) erläutert:

(60) *Skopusregel*

In α kann ein Bedeutungselement *B (K1)* im Skopus eines Bedeutungselements *B (K2)* liegen gdw. in α die Konstituente *K<sup>1</sup>* in der formalen Beziehung SR zur Konstituente *K<sup>2</sup>* steht.

(61) *Zuordnung*

In einem Ausdruck α ist ein Bedeutungselement *BE* einer Konstituente *K* 'zugeordnet' gdw. *BE* die Übersetzung von *K* ist. In diesem Fall hat *BE* den Namen *B (K*).

Bei der in (60) genannten Beziehung SR kann man an K-Herrschaft innerhalb eines bestimmten Bereichs oder an eine beliebige geeignete Verfeinerung denken. Die Skopusregel ist in dem Sinn fakultativ,<sup>6</sup> daß *B (K1)* nicht generell im Skopus von *B (K2)* liegen muß, wenn *K<sup>1</sup>* in der Beziehung SR zu *K<sup>2</sup>* steht.

Es ist aus allgemeinen Gründen anzunehmen, daß in Sätzen wie (55b) die subordinierende Partikel *daß* nicht in der Beziehung SR zur Negationspartikel *nicht* steht. Also kann das Bedeutungselement VERUM, das dem *daß* zugeordnet ist, nicht im Skopus der Negation liegen. Andererseits ist wohlbekannt, daß ein finites Verb in Anfangsstellung wie das *hört* in (55a) im Skopus von Elementen des Mittelfelds – in (55a) also im Skopus von *nicht* – liegt.<sup>7</sup> Da wir annehmen, daß dieses finite Verb dem VERUM-Element zugeordnet ist, kann VERUM deshalb in (55a) im Skopus der Negation liegen. Ebenso in (57a)–(59a). Diese Skopusbeziehung zu VERUM ist erwartungsgemäß fakultativ, wie man bei (4) und (12) sieht.<sup>8</sup>

### **6.2 Verhältnis zu anderen Fokus-Typen**

Es ist bemerkenswert, daß es Daten wie den 'negierten' F-Verum-Fokus überhaupt gibt. Unter naheliegenden Annahmen über die Gebrauchsbedingungen von semantischem Fokus könnte man vermuten, daß in allen besprochenen Fäl-

	- b. also bis morgen; du nimmst ja auch an der Sitzung teil
	- c. es *trifft vielleicht zu*, daß ich da teilnehme
	- b. Karl hat wahrscheinlich kaum einen Aufsatz von mir gelesen
	- c. für die *meisten x*, *x* ein Aufsatz von dir, *trifft* es *zu*, daß Karl *x* gelesen hat

<sup>6</sup>Diese Annahme ist durch Beobachtungen und Überlegungen motiviert, die nichts mit Verum-Fokus zu tun haben. Dieser Beitrag ist nicht der Ort, näher auf diese Annahmen einzugehen, ebenso wie die genauere Charakterisierung von SR nicht unser Thema ist. Für unsere Zwecke müssen und können wir uns mit einem ungefähren intuitiven Verständnis der einschlägigen Ideen begnügen.

<sup>7</sup>Dies ist ein klassisches 'Rekonstruktions'-Phänomen; vgl. Höhle (1991), bes. §§3.1.3. und 6.2. Zur formalen Beschreibung von Rekonstruktionsphänomenen hat man zwei Alternativen: Man berücksichtigt sie direkt bei der Charakterisierung der Beziehung SR ('Pseudo-Rekonstruktion'); oder man schafft eine Repräsentationsebene, bei der die relevanten Eigenschaften eines Spurbinders an der Position der Spur verfügbar sind, und wendet die Skopusregel auf diese Repräsentationsebene an ('echte Rekonstruktion'). Für unsere Zwecke ist dieser Unterschied vorläufig ohne Belang; erst in Abschnitt 10.2 kommen wir darauf zurück.

<sup>8</sup>Der aus der Rekonstruktion des finiten Verbs resultierende (fakultative) Skopuseffekt ist bei der Negation unübersehbar, aber er besteht natürlich auch bei anderen skopusinduzierenden Ausdrücken, z. B. bei *vielleicht* in (i.a) als Erwiderung zu (i.b) und – worauf mich Joachim Jacobs hingewiesen hat – beim Quantorenskopus von *die meisten* in (ii.a) als Erwiderung zu (ii.b):

10 Über Verum-Fokus im Deutschen

len der Negationsträger betont sein müßte. Anstelle von (55a) usw. sollten in den gegebenen Kontexten dann nur die Betonungen von (62) möglich sein:

	- b. aber Karl hat kein Drehbuch geschrieben
	- c. sie macht mir nicht den Garaus
	- d. hört sie denn nicht damit auf?

In der Tat wären auch diese Betonungen kontextuell angemessen, aber sie sind nicht die einzig möglichen, und ihr Effekt ist nicht derselbe: Bei ihnen ist (nur) die Negation hervorgehoben, nicht das (negierte) Wahrheitsprädikat. Unter der Voraussetzung, daß unabhängig existierende Gesetzmäßigkeiten den negierten Verum-Fokus verfügbar machen und sein Hervorhebungseffekt verschieden von (62) ist, ist es natürlich, daß er nicht vom reinen Negationsfokus (62) verdrängt wird.

Die gleiche Frage stellt sich hinsichtlich des Differenz-Fokus. Wir haben in Abschnitt 2.3 gesehen, daß dann, wenn semantischer Fokus und Differenz-Fokus in Konkurrenz zueinander stehen – d. h., wenn beide mit gleichen Hervorhebungseffekten anwendbar sind und zu verschiedenen Konstituentenbetonungen führen –, der Differenz-Fokus bevorzugt wird. Der Ausdruck *m*, durch den sich z. B. (63a) (= (59a)) von dem relevanten Teil von (63b) (= (59b)) unterscheidet, ist das *nicht*:

	- b. … daß sie damit aufhört
	- c. hört sie denn nicht damit auf?

Man könnte also erwarten, daß die Regeln für den Gebrauch von Differenz-Fokus wieder dazu führen, daß (63c) (= (62d)) bevorzugt wird. Daß dies nicht der Fall ist, kann man sich vermutlich so erklären: Der Differenz-Fokus würde in diesen Fällen unvermeidbar mit einem reinen Negationsfokus zusammenfallen. Aber der hat, wie besprochen, einen anderen Effekt als der negierte Verum-Fokus. Das heißt: Der negierte Verum-Fokus ist nicht ein semantischer Fokus, der in Konkurrenz zum Differenz-Fokus steht, denn der Differenz-Fokus hat nicht denselben Hervorhebungseffekt. Da keine Konkurrenzbeziehung besteht, wird der Differenz-Fokus nicht bevorzugt.

### **6.3 Alternativenbezug**

Wenn die IT-Deutung von VERUM falsch ist, gibt es keine unabhängige Motivation dafür, einen solchen Bedeutungsbestandteil überhaupt anzunehmen. Seine

Funktion erschöpft sich darin, daß er dazu beiträgt, die Intuition der Hervorgehobenheit zu explizieren. Wäre die Intuition nicht in ganz eigenartiger Weise an die Betonung ganz spezifischer Ausdrücke – finite Verben und Konjunktionen wie *daß* – gebunden, würde man dem Phänomen schwerlich ein grammatisches Interesse zusprechen.

Zu den verdächtigen Eigenschaften von VERUM gehört, daß nicht klar ist, ob der Verum-Fokus einen Bezug zu paradigmatischen Alternativen impliziert. Ein solcher (u. U. impliziter) Bezug zu alternativen Bedeutungselementen in gleicher Funktion ist sonst die Regel, und einige Autoren (z. B. Jacobs 1988) betrachten ihn als notwendige Bedingung für jeden semantischen Fokus. Zunächst läge es nahe, VERUM mit der Negation und Ausdrücken wie *vielleicht*, *wahrscheinlich* u. ä. als Element einer Klasse WF von Bedeutungselementen aufzufassen, die ein Sprecher dazu benutzt, um seine Meinung über den Wahrheitsgehalt eines Gedankens p zur Kenntnis zu bringen. (Ein solcher Vorschlag findet sich z. B. bei Jacobs (1986).) Insofern haben diese Elemente gleiche Funktion: Ein Element *E<sup>i</sup>* aus WF tritt immer in der semantischen Struktur *E<sup>i</sup>* (p) auf. Es ist aber bekannt, daß diese Elemente – im Unterschied zu den meisten anderen Typen von Bedeutungselementen – rekursive Einbettung erlauben, so daß innerhalb einer semantischen Struktur mehrere dieser Elemente verknüpft sein können, etwa *E<sup>i</sup>* (*Ej* (p)), *Ei* (*Ej* (*Ek*(p))) usw. In diesem Sinn sind sie nicht alternativ zueinander. Wenn z. B. VERUM und Negation einander ausschließende Alternativen wären, dann könnte es als Erwiderung zu (64d) (*≈* (55c)) nur (64a) oder (64b) (= (62a)) geben:

	- b. (nein) er hört ihr nicht zu
	- c. (nein) er hört ihr nicht zu
	- d. ich hoffe, er hört ihr zu

Wir haben aber gesehen, daß es in diesem Kontext auch (64c) (= (55a)) gibt, wo VERUM und Negation in genau derselben Weise gemeinsam hervorgehoben sind, wie sie es in (65) als Erwiderung zu (64d) sind:

(65) es ist nicht der Fall, daß er ihr zuhört

Entsprechende Überlegungen kann man für *nicht* anstellen. In (64b) bildet es einen minimalen Fokus. Zu welchen Alternativen steht es in Bezug? Man kann z. B. an *vielleicht* und *bestimmt* wie in (66) denken:

(66) a. vielleicht hört er ihr zu

```
b. er hört ihr bestimmt zu
```
Aber genau wie in (64c) schließen diese Elemente das *nicht* nicht aus; auch (67a,b) wären angemessene Erwiderungen zu (64d):

10 Über Verum-Fokus im Deutschen

	- b. er hört ihr bestimmt nicht zu

Daraus möchte man nicht schließen, daß in (64b) kein semantischer Fokus vorliegt. Zugleich möchte man nicht gern darauf verzichten, den Alternativenbezug als eine fundamentale Eigenschaft des semantischen Fokus zu betrachten, denn diese Annahme erlaubt es, den Fokus bei den verschiedenen Gradpartikeln (einschließlich Negation) und den pragmatischen Fokus ('Assertionsfokus' usw.) als fundamental gleich zu verstehen.

Die Lösung des Problems dürfte einfach darin liegen, daß die Vorstellung der einander ausschließenden Alternativen zu eng am Normalfall orientiert ist. Da 'normale' Bedeutungselemente eines Funktionstyps nicht rekursiv einbettbar sind, schließen sie einander aus. Bei der Klasse WF ist das nicht so. Als die Menge der möglichen Alternativen muß man deshalb nicht die Menge WF selbst auffassen, sondern die Menge der möglichen Verknüpfungen der Elemente von WF.

### **7 Endstellung**

Rekapitulieren wir kurz einige Überlegungen. Unter der Annahme, daß der F-Verum-Fokus ein semantischer Fokus ist, muß dem finiten Verb ein Element VERUM zugeordnet sein. Unter der IT-Deutung scheint es zunächst naheliegend, diese Zuordnung auf Verben in Anfangsstellung zu beschränken, denn im Allgemeinen wird der Illokutionstyp eines Satzes durch den morphologischen Modus und die relative Position des finiten Verbs in Anfangsstellung (mit)bestimmt. Allerdings ist dieser Zusammenhang mit der Anfangsstellung schon unter der IT-Deutung nicht unproblematisch, wie wir in Abschnitt 3.2 gesehen haben. Darüber hinaus ist die IT-Deutung aus zwei voneinander unabhängigen Gründen nicht haltbar: wegen der eingebetteten Fälle von Abschnitt 5 (und eventuell 4.3) und wegen der Skopusdaten von Abschnitt 6.

Da die Skopusdaten auf allgemeine Skopuseigenschaften finiter Verben zurückgehen, legt sich nun die Vermutung nahe, daß finite Verben ganz allgemein – also nicht nur bei Anfangsstellung – dem VERUM-Element zugeordnet sind. Wenn dem so ist, müßte es einen Verum-Fokus geben bei Endstellung des finiten Verbs. Hier sind Beispiele wie (68) relevant:

	- b. ich hoffe, daß sie damit aufhört
	- c. ich hoffe, daß sie damit aufhört

Bei Verbzweitstellung in (a) ergibt sich ein normaler Verum-Fokus. Bei Verbendstellung in (b) und (c) ergeben sich völlig andere Effekte. Wenn nur das finite Verb *hört* betont ist, wie in (b), kann man das möglicherweise als einen *W*-Fokus deuten, der etwa als Erwiderung zu (69) möglich wäre:

(69) du hoffst wohl, daß sie damit aufhören

Aber andere Deutungen sind kaum möglich; insbesondere kann (b) nicht als Verum-Fokus verstanden werden. Wenn man die (sehr problematische) Annahme machen möchte, daß in (b) und (c) das Verb *hört* mit dem Verbzusatz *auf* ein Wort (ein Kompositum) bildet, könnte man erwarten, daß (c) die systematische Entsprechung zu (a) ist. Aber das ist nicht der Fall. Diese Betonung kann unter Fokusprojektion als Hervorhebung der Bedeutung des Komplexes *auf-hör-* verstanden werden, aber auf keinen Fall als Verum-Fokus. Verbindungen von Verb und Verbzusatz verhalten sich generell nach dem Muster (68).

Idiomatische Komplexe wie in (70) folgen demselben Muster:

	- b. # Hanna fürchtet, daß er ihr die Leviten liest
	- c. ich kann mir nicht vorstellen, daß er Hanna die Leviten liest

Als Erwiderung zu (c) ist (a) ein normaler Verum-Fokus. Die entsprechende Form mit Endstellung (b) hat nicht denselben Effekt. In einem anderen Kontext könnte (b) als Hervorhebung des Präsens (im Gegensatz zu *las*) gedeutet werden. Aber im Kontext (c) ist (b) offenbar überhaupt unangemessen.

Ganz anders ist es bei der Kopula:

	- b. Karl meint, daß sie in Rom ist
	- c. ich möchte wissen, ob sie in Rom ist

Ein großer Teil der Sprecher empfindet zwischen (a) und (b) als Erwiderung zu (c) keinen nennenswerten Unterschied. Normale Vollverben verhalten sich wieder anders:

	- b. Hanna meint, daß er ein Drehbuch schreibt
	- c. ich möchte wissen, ob Karl ein Drehbuch schreibt

Alle Sprecher empfinden zwischen (a) und (b) als Erwiderung zu (c) einen Unterschied. Jeder findet (a) unproblematisch. Viele schätzen (b) als kontextuell unangemessen ein, d. h., sie halten es nicht für möglich, (b) als Verum-Fokus zu

### 10 Über Verum-Fokus im Deutschen

interpretieren. Andere halten das – mit individuell stark variierender Zuversicht – für halbwegs möglich.<sup>9</sup>

Den Unterschied zwischen Kopula und normalen Vollverben muß man offensichtlich auf lexikalische Eigenschaften der Kopula zurückführen. Möglicherweise ist sie nicht (wie häufig vermutet) semantisch völlig leer, sondern hat einen Gehalt, den man als 'Bestehen einer Prädikationsbeziehung zwischen *x* und *y*' umschreiben kann. Wenn das richtig ist, ist die Hervorhebung dieser Bedeutung intuitiv vermutlich kaum vom Verum-Fokus zu unterscheiden.

Wie man die Verhältnisse bei den Vollverben wie in (72) adäquat zu deuten hat, ist schwer zu beurteilen. Man kann nicht annehmen, daß bei Endstellung schlechthin ein F-Verum-Fokus möglich ist. Dazu divergieren die Urteile über (72b) zu stark, und Fälle wie (68) und (70) sowie der auffällige Unterschied zur Kopula sind damit nicht verträglich. Aber wenn man Verum-Fokus bei (72b) als ungrammatisch betrachtet, bleibt die Aufgabe, zu erklären, wieso ihn etliche Sprecher doch für möglich halten.

Ich will diese wichtige Frage hier unbeantwortet lassen und verfolge im weiteren die Konsequenzen der Annahme, daß es keinen F-Verum-Fokus bei Endstellung des finiten Verbs gibt.

### **8 Segmentale Lokalisierung von VERUM**

Wenn es einen Verum-Fokus dann und nur dann gibt, wenn (i) *daß* usw. oder (ii) ein finites Verb in Anfangsstellung betont ist, stellt sich die Frage, aufgrund welcher Gesetzmäßigkeiten grade diese Ausdrücke einem VERUM-Element zugeordnet sind.

Bei den lexikalischen C-Wörtern (subordinierenden satzeinleitenden Partikeln) wie *daß* kann man sich vorstellen, daß die Zuordnung zu VERUM dadurch ausgelöst wird, daß (a) sie eine lexikalisch gegebene Eigenschaft – sagen wir: eine Merkmalspezifikation [+VER] – haben oder (b) ganz allgemein die syntaktische Position C, in der sich diese Partikeln befinden, eine solche Eigenschaft hat und daß [+VER] als *λP* (VERUM *P*) übersetzt wird. Bei den finiten Verben kann die Zuordnung nicht durch eine Eigenschaft der Verben selbst ausgelöst werden, sondern nur durch eine Eigenschaft der Position, in der sie sich bei Anfangsstellung befinden. Ich will diese syntaktische Position als F-Position bezeichnen. Die F-Position könnte allgemein [+VER] haben. Das vorangestellte finite Verb

<sup>9</sup>Tatsächlich begegnet man Fällen wie (72b) gelegentlich in natürlicher Kommunikation. Leider ist dieses Faktum als solches nicht sehr aussagekräftig, denn 'falsche' – d. h. kontextuell unangemessene – Betonungen sind eher häufiger als andere Performanzfehler, keineswegs seltener.

könnte mit (den Merkmalspezifikationen) der F-Position unifiziert sein, so daß die Übersetzung des Verbs in F-Position wieder den Ausdruck *λP* (VERUM *P*) enthält.

Wenn man einem Vorschlag von den Besten (1989: Appendix II) über die Natur der F-Position folgt, ergibt sich ein bestechend einfaches Bild. Danach befindet sich das vorangestellte finite Verb in einer Position, die mit der C-Position von *daß* usw. identisch ist. Nach den Besten ist die F-Position die C-Position.

Unglücklicherweise ist die Parallelität von F- und C-Verum-Fokus die stärkste direkte Stütze für den Bestens Idee. Ansonsten ist die Idee empirisch eher problematisch. Ursprünglich schien sie erklärenden Charakter zu haben, da aus ihr (in Verbindung mit einigen weiteren Annahmen) deduktiv folgen sollte, daß die Verbanfangsstellung nicht zusammen mit einem C-Wort vorkommt:

	- b. (Heinz glaubt) daß Maria nicht geschlafen hat
	- c. \* (Heinz glaubt) daß Maria hat nicht geschlafen
	- d. \* (Heinz glaubt) daß hat Maria nicht geschlafen
	- e. \* (Heinz glaubt) hat daß Maria nicht geschlafen

Diese 'komplementäre Verteilung' von C-Wörtern und Verbanfangsstellung gilt in dieser Form aber nur für das Deutsche und das Niederländische. In sämtlichen anderen germanischen Sprachen, die das Verbvoranstellungsphänomen aufweisen, existieren Äquivalente von (73c), teils als stark beschränkt vorkommende Varianten der Äquivalente von (73b), teils als völlig unauffällige Alternativen mit geringen Vorkommensbeschränkungen. Und in keltischen Sprachen, die generell das finite Verb voranstellen, sind die Äquivalente von (73d) obligatorisch. Es kann also nicht sein, daß aus Prinzipien der Universalen Grammatik deduktiv folgt, daß die Voranstellung eines finiten Verbs wie in (73c) und (73d) unmöglich ist. Natürlich kann man den Bestens Idee so modifizieren, daß sie mit diesen Beobachtungen kompatibel ist;<sup>10</sup> dabei verliert sie aber ihren erklärenden Charakter und nimmt vorwiegend deskriptiven Charakter an. Und als deskriptive Theorie ist sie nur eine unter vielen, die mit den Daten verträglich sind.

Selbst bei geeigneter Abschwächung und Modifikation führt diese Idee dazu, daß Verbanfangsstellungssätze und durch ein C-Wort eingeleitete Sätze dersel-

<sup>10</sup>Man kann z. B. stipulieren, daß ein C<sup>0</sup> -Element die markierte Möglichkeit hat, eine CP zu selegieren. Dabei kann man darauf verweisen, daß solche Konstruktionen im Spanischen unter gewissen Bedingungen explizit auftreten; vgl. Plann (1982). Dann muß man zusätzlich stipulieren, daß das Deutsche und das Niederländische von dieser markierten Möglichkeit keinen Gebrauch machen.

### 10 Über Verum-Fokus im Deutschen

ben Kategorie angehören. Dabei ist es evident, daß diese Satztypen ganz verschiedene Eigenschaften haben und verschieden distribuiert sind. Dazu gehört nicht nur die offensichtliche Tatsache, daß normale Deklarativsätze Verbzweitstellung und niemals eine Einleitung durch ein C-Wort aufweisen. Neben diversen anderen Unterschieden bestehen z. B. auch die zwischen (74) und (75):

	- b. kommt [man nach Hause *e*] und [da steht der Gerichtsvollzieher vor der Tür], …
	- b. \* kommt [man nach Hause *e*] und [daß da der Gerichtsvollzieher vor der Tür steht], …

In (74) ist ein Verbzweitstellungssatz innerhalb eines Konditionalsatzes mit einer Verbendstellungsstruktur koordiniert; dabei ist in (74b) die Verbendposition durch eine Spur *e* gefüllt, die von dem vorangestellten finiten Verb gebunden wird. In (75) ist der Verbzweitstellungssatz durch einen *daß*-Satz ersetzt; das Resultat ist Wortsalat. Es ist niemals ein Vorschlag gemacht worden, wie man diese und andere Unterschiede deskriptiv erfassen oder gar theoretisch deuten könnte, wenn kein kategorialer Unterschied zwischen Verbzweitstellungssätzen und durch C eingeleiteten Sätzen besteht.<sup>11</sup>

Gelegentlich trifft man auf die Vorstellung, daß die angedeuteten Probleme durch einen Vorschlag von Kayne (1982) gelöst sind. Kayne hat die Idee geäußert, daß (a) C-Wörter nominalen Charakter haben und die von ihnen eingeleiteten Sätze demzufolge nominal sind, und (b) ein in der C-Position befindliches Verb dem Satz verbalen Charakter verleiht. Nach meiner Kenntnis gibt es jedoch keine Ausarbeitung dieser Idee, aus der hervorgeht, wie diese Mechanismen im Detail funktionieren, aus welchen allgemeinen Prinzipien sich ihre Wirkungsweise ergibt und wie diese mit den Spurbindungsgesetzen und deren Funktionen interagieren. Natürlich ist auch nicht demonstriert, wie sich die spezifischen empirischen Eigenschaften der Satztypen im Detail aus diesen Annahmen ergeben.<sup>12</sup>

Trotz aller offener Fragen möchte ich für die Diskussion in den folgenden Abschnitten Annahmen benutzen, die man als Variante der Ideen von den Besten und Kayne verstehen kann:

<sup>11</sup>Für einen Vorschlag zur Deutung von asymmetrischen Koordinationen wie in (74) vgl. Höhle (1990).

<sup>12</sup>Für eine jüngere Skizze verwandter Ideen vgl. Penner & Bader (1991).

### (76) *[+VER]* in Φ


Die Konstituente Π soll das Mittelfeld, den Verbalkomplex und das Nachfeld umfassen (also das, was ich an anderem Ort als S-Feld bezeichnet habe). Man kann Π wahrscheinlich als eine maximale Projektion des Verbs auffassen, in der das Subjekt enthalten ist. C-Wörter befinden sich in der Φ-Position. Da sie keine Spur binden, tragen alle ihre Head-Merkmale zur Determination der Kategorie des Satzes bei. In Sätzen mit Verbanfangsstellung befindet sich (statt dessen) ein finites Verb in der Φ-Position. Sofern irgendwelche Head-Merkmale des Verbs nicht an der vom Verb gebundenen Spur auftreten, sind sie 'frei' und tragen zur Determination der Kategorie des Satzes bei. (Wenn die Spur z. B. verbale Merkmale hat, sind diese Merkmale am Verb in Φ nicht 'frei'; der Satz hat dann also keinen verbalen Charakter.) Da die Generierung von VERUM durch [+VER] ausgelöst wird und diese Merkmalspezifikation Bestandteil einer syntaktischen Kategorie – also eines Segments der syntaktischen Struktur – ist, kann man sagen, daß VERUM nach (76vi) segmental lokalisiert ist.

### **9 Verum-Fokus in R/W-Sätzen**

### **9.1 C-Verum-Fokus in R/W-Sätzen**

Wir haben in Abschnitt 5.2 den Verum-Fokus bei Betonung von C-Wörtern wie *daß* und *ob* betrachtet. In Dialekten, die in Relativsätzen und/oder W-Interroga10 Über Verum-Fokus im Deutschen

tivsätzen eine C-Partikel zulassen, resultiert aus der Betonung der Partikel eine Hervorhebung, die offenbar identisch ist mit dem C-Verum-Fokus.<sup>13</sup>

Zunächst Relativsätze:

	- b. ich kenne nur wenige Leute, die (wo) dieses Buch gelesen haben
	- c. jeder *x* für den gilt, daß es *zutrifft*, daß *x* das Buch gelesen hat, …

Wenn (77a) als Fortsetzung von (77b) geäußert wird, ist der Inhalt des Relativsatzes bekannt, und es geht darum, hervorzuheben, daß die durch den Relativsatz ausgedrückte Restriktion in gewissen Fällen erfüllt ist; der Effekt kann etwa wie in (77c) umschrieben werden. Ähnlich in W-Interrogativen:

	- b. du hast mir erzählt, mit wem (daß) du nicht getanzt hast
	- c. … wissen, für welches *x* es *zutrifft*, daß du mit der Person *x* getanzt hast
	- b. du hast mir erzählt, wen (daß) du nicht reingelegt hast
	- c. … wissen, für welches *x* es *zutrifft*, daß du die Person *x* reingelegt hast

Wenn (a) als Fortsetzung von (b) geäußert wird, hat das den Hervorhebungseffekt, der in (c) umschrieben ist.

Diese Fälle stehen in voller Übereinstimmung mit den Annahmen von (76). Aus (76) geht auch korrekt hervor, daß die Betonung des Relativ- bzw. Interrogativpronomens bei vorhandener C-Partikel, wie in (80), ganz andere (keine Verum-Fokus-) Effekte hat (sofern die Beispiele überhaupt grammatisch möglich erscheinen), so daß die Betonungen von (80) in den Kontexten von (77b)–(79b) vermutlich gar nicht angemessen sein können:

	- b. jetzt möchte ich wissen, mit wem daß du getanzt hast
	- c. jetzt möchte ich wissen, wen daß du reingelegt hast

<sup>13</sup>Für Daten und Diskussion zu diesem Abschnitt danke ich Josef Bayer.

In derselben Weise trägt (76) dem Fall (81) (=(29)) mit Verbzweitstellung Rechnung, wo ebenfalls kein Verum-Fokus möglich ist:

(81) wer hat den Hund (denn) getreten?

### **9.2 RW-Verum-Fokus**

In den Varianten des Deutschen, die in Relativsätzen und W-Interrogativsätzen keine C-Partikel zulassen, ergibt sich eine interessante Beobachtung. Das standarddeutsche Pendant zu (77) ist (82):<sup>14</sup>

	- b. ich kenne nur wenige Leute, die dieses Buch gelesen haben
	- c. jeder *x* für den gilt, daß es *zutrifft*, daß *x* das Buch gelesen hat, …

Die Hervorhebungseffekte sind in (82) exakt dieselben wie in (77), nur werden sie hier durch die Betonung des Relativpronomens ausgelöst. Bei W-Interrogativsätzen ist es ganz entsprechend. Das Pendant zu (79) ist (83):

	- b. du hast mir erzählt, wen du nicht reingelegt hast
	- c. … wissen, für welches *x* es *zutrifft*, daß du die Person *x* reingelegt hast

In dem durch (b) gegebenen Kontext ist bekannt, daß zur Debatte steht, daß der Angesprochene eine Person *x* reingelegt hat, und es ist mindestens eine unkorrekte Belegung der Variablen *x* bekannt. Hervorgehoben ist, daß der Sprecher die korrekte Belegung dieser Variablen erfahren möchte, ganz so wie in (79) und ähnlich wie in (11).

Fälle wie (82a) und (83a), bei denen ein Verum-Fokus durch die Betonung eines Relativ- bzw. Interrogativausdrucks ausgelöst wird, will ich RW-Verum-Fokus

<sup>14</sup>Auf Fälle vom Typ (82a) bin ich durch Beispiel (123) bei Gussenhoven (1984) aufmerksam geworden. Gussenhoven meint, daß im Niederländischen bei Sätzen mit Verbendstellung ein 'polarity focus' immer dann und nur dann ausgelöst wird, wenn die Betonung " on the COMPnode" liegt. Außer einem Relativsatz wie (82a) führt er noch je ein Beispiel mit der Komparativpartikel *dan* 'als', mit der Partikel *om* 'um' als Einleitung infiniter Konstruktionen und mit *dat* 'daß' auf (Gussenhoven 1984: 53). Die deutschen Äquivalente der Beispiele mit *dan*, *om* und *dat* sind nach meinem Urteil nicht voll akzeptabel oder haben jedenfalls keinen Verum-Fokus.

### 10 Über Verum-Fokus im Deutschen

nennen. Ein RW-Verum-Fokus ist, wie man erwarten kann, auch bei komplexen R- bzw. W-Phrasen möglich:<sup>15</sup>

	- b. Hanna tanzt nur ganz selten
	- c. die paar Leute *x* für die gilt, daß es *zutrifft*, daß sie mit *x* getanzt hat
	- b. du hast mir erzählt, mit wem du nicht getanzt hast
	- c. … wissen, für welches *x* es *zutrifft*, daß du mit der Person *x* getanzt hast
	- b. ich habe von den meisten Schriftstellern so gut wie nichts gelesen
	- c. ein Autor *x* für den gilt, daß es *der Fall* ist, daß ich das Werk von *x* gelesen habe, …
	- b. du hast also weder Karls noch Hannas Aufsatz gelesen
	- c. sag … , für welches *x* es *zutrifft*, daß du den Aufsatz der Person *x* gelesen hast

	- b. du hast berichtet, daß Karl nicht an Ute gedacht hat und daß Heinz nicht an Hanna gedacht hat
	- c. … wissen für jedes *x*, für welches *y* es *der Fall* ist, daß die Person *x* an die Person *y* gedacht hat

Das gleiche scheint für R-Pronomen zu gelten:

	- b. du erzählst mir, daß Karl sich nicht um Ute gekümmert hat und daß Heinz sich nicht um Hanna gekümmert hat
	- c. … suche für jedes *x* nach der Person *y* für die es *zutrifft*, daß die Person *x* sich um *y* gekümmert hat

Wie die Umschreibung (ii.c) zum Ausdruck bringt, hat (ii.a) als Fortsetzung von (ii.b) anscheinend eine Lesart, bei der VERUM im Skopus der Relativphrase und diese im Skopus von *jeder* liegt.

<sup>15</sup>Der W-Quantor, in dessen Skopus VERUM in den betrachteten Fällen liegt, nimmt erwartungsgemäß an den bekannten Skopusambiguitäten mit *jed-* teil, wie in (i.a) als Fortsetzung von (i.b):

Dabei muß die Betonung immer auf dem R-/W-Pronomen liegen, auch dann, wenn es wie in (86a) und (87a) nicht der Fokusexponent der R-/W-Phrase ist. Die Betonung des Fokusexponenten, wie in (88), ergibt hier völlig andere Effekte, so daß diese Sätze in den Kontexten (86b) bzw. (87b) unangemessen wären:

	- b. nun sag doch mal, wessen Aufsatz du gelesen hast

Es liegt auf der Hand, daß der RW-Verum-Fokus nicht ohne weiteres mit der Annahme vereinbar ist, daß [+VER] in Φ lokalisiert ist.

### **10 VERUM ohne segmentale Lokalisierung**

### **10.1 Struktur von R-/W-Sätzen**

Es ist eine alte und bisher nicht befriedigend geklärte Frage, welche Konstituentenstruktur der Anfangsbereich von Sätzen ohne C-Partikel wie (89) hat:

	- b. wen daß du reingelegt hast

Bei (90) ist es naheliegend, *daß* und *wo* in der Φ-Position und *der* bzw. *wen* in der 'Spezifikatorposition' von Φ (also als Tochter der maximalen Projektion von Φ) anzusiedeln. Bei (89) hat man im wesentlichen 3 Möglichkeiten:

	- ii. (89) hat dieselbe syntaktische Struktur wie (90), aber Φ ist phonologisch leer.
	- iii. In (89) besetzt die R-/W-Phrase die Φ-Position.

Jede der 3 Möglichkeiten wirft eine Fülle von Fragen auf. Besonders (91iii) ist problematisch, da hier vorausgesetzt wird, daß eine komplexe syntaktische Phrase zugleich als nullte Projektionsstufe der Kategorie Φ fungiert. Trotzdem sind Strukturierungen dieser Art gelegentlich vorgeschlagen worden, z. B. von Bayer (1990). Hier ist nicht der Ort, auf die verschiedenen Fragen der syntaktischen Theorie näher einzugehen. Uns soll in erster Linie interessieren, welche Konsequenzen sich aus (91) ergeben für die Zuordnung von VERUM zu dem betonten Ausdruck beim RW-Verum-Fokus.

10 Über Verum-Fokus im Deutschen

Wenn (91i) korrekt ist, wird der RW-Verum-Fokus nicht von (76) erfaßt. Es scheint aber offensichtlich, daß der RW-Verum-Fokus von derselben Art ist wie der C-Verum-Fokus (und, vermutlich, der F-Verum-Fokus); also sollte es eine einheitliche Theorie dafür geben. Also ist (91i) oder/und (76) falsch.

Wenn (91ii) korrekt ist, hat man [+VER] in dem phonologisch leeren Φ als Auslöser für die Generierung von VERUM. Aber wie soll dieses VERUM dem R- /W-Pronomen zugeordnet werden, so daß sich bei dessen Betonung der Verum-Fokus ergibt? Ich sehe keine plausible Antwort auf diese Frage. Deshalb nehme ich an, daß (91ii) oder/und (76) falsch ist.

Wenn (91iii) korrekt ist, kann man sich vorstellen, daß (76) für einfache Fälle wie (92a) (=(82a)) und (92b) (=(83a)) das richtige Ergebnis liefert:

	- b. wen du reingelegt hast

Das gilt vermutlich auch für komplexe Fälle wie (93a) (=(84a)) und (93b) (=(85a)):

	- b. mit wem du getanzt hast

Da hier der Fokusexponent der Präpositionalphrase betont ist, bildet die ganze Präpositionalphrase einen möglichen Fokus. In die Übersetzung von Φ geht einerseits die Übersetzung der Präpositionalphrase und andererseits die Übersetzung von [+VER] ein. Bei geeigneter Präzisierung des Zuordnungsbegriffs von (61) dürfte sich korrekt ergeben, daß bei dieser Betonung VERUM hervorgehoben sein kann.

Für Fälle wie (94a) (=(86a)) und (94b) (=(87a)) reichen diese Annahmen jedoch nicht aus:

	- b. wessen Aufsatz du gelesen hast

Hier bildet nicht die ganze Nominalphrase *dessen Werk* bzw. *wessen Aufsatz* einen möglichen Fokus, also ist das bei der Übersetzung von Φ generierte VERUM nicht dem Fokus (nämlich *dessen* bzw. *wessen*) zugeordnet, und es könnte keinen Verum-Fokus geben. In der gegebenen Formulierung ist (91iii) oder/und (76) falsch.<sup>16</sup>

<sup>16</sup>Man könnte daran denken, die Annahme (91iii) um einen 'Perkolationsmechanismus' anzureichern, der dafür sorgt, daß [+VER] aus Φ an die Position von *dessen/wessen* gelangt, so daß diese Ausdrücke dem VERUM zugeordnet werden könnten. Ich halte diesen Weg aus empirischen und theoretischen Gründen für aussichtslos.

Es ergibt sich also, daß keine der 3 alternativen Strukturannahmen in (91) den Beobachtungen beim RW-Verum-Fokus Rechnung tragen kann, wenn man an (76) festhält. Man muß (einen Teil von) (76) aufgeben, oder man muß andere Strukturannahmen machen. Tatsächlich kommt man vermutlich auch bei Verzicht auf (76) nicht mit (91) aus. Deshalb gehen wir zunächst auf die Struktur ein.

### **10.2 PR-Struktur**

Beim C-Verum-Fokus wird die Hervorhebung von VERUM durch die Betonung einer C-Partikel ausgelöst. Beim RW-Verum-Fokus wird die gleiche Hervorhebung durch die Betonung eines R-/W-Pronomens ausgelöst. Wenn in den beiden Fällen die gleichen Zuordnungsmechanismen wirksam sind, muß das R-/W-Pronomen vermutlich eine strukturell ähnliche Position innehaben wie die C-Partikel. Auf der S-Struktur ist das offensichtlich nicht der Fall. Eine strukturell ähnliche Konfiguration erhält man jedoch, wenn man das R-/W-Pronomen (oder eine abstrakte Repräsentation desselben) von der R-/W-Phrase trennt, in der es enthalten ist, und die Phrase in die Position ihrer Spur setzt ('echt rekonstruiert'). Durch eine solche Trennung von Pronomen und enthaltender Phrase werden die syntaktischen 'Pied Piping'-Effekte beseitigt; in der Anfangsposition des Satzes steht auf der so geschaffenen Repräsentationsebene nur das Pronomen, das der Auslöser für die syntaktische 'Bewegung' der R-/W-Phrase in die Anfangsposition ist. Die durch diese partielle 'Rekonstruktion' charakterisierte Repräsentation möge PR-Struktur heißen. Die PR-Struktur von (93a) hat dann etwa die Form (95a), und die PR-Struktur von (94a) hat etwa die Form (95b):

	- b. dessen [ich [*e* Werk] gelesen habe]

Es ist unstrittig, daß eine Trennung von R-/W-Pronomen und enthaltender Phrase – also eine Beseitigung der Pied Piping-Effekte – für semantische Zwecke benötigt wird; aber wie eine solche Trennung formal darzustellen ist, ist zunächst nicht klar (vgl. z. B. Engdahl (1986) und dort genannte Literatur). Vor allem ist strittig, ob und in welcher Weise irgendeine Form der Rekonstruktion stattfinden sollte. Die Überlegungen zum RW-Verum-Fokus legen genau die in (95) veranschaulichte Form der Rekonstruktion nahe, denn anders ist nicht zu erreichen, daß Pronomen am Satzanfang und C-Partikeln sich in ähnlichen Konfigurationen befinden.

Zugleich ist es zweifelhaft, ob die durch den RW-Verum-Fokus motivierte Abtrennung mit der semantisch motivierten zusammenfällt. Es scheint klar zu sein,

### 10 Über Verum-Fokus im Deutschen

daß bei sog. 'Präpositionaladverbien' wie *davon/wovon, dafür/wofür, damit/womit* usw. das *wo* als R-/W-Pronomen fungiert. Demgemäß sollte ein Verum-Fokus möglich sein, wenn dieses *wo* betont ist. Das ist auch der Fall, wenn *wo* in der S-Struktur isoliert ist, wie in (96a). Es ist nicht der Fall, wenn es Teil der Verbindung *wo*+Präposition ist, wie in (96b):

	- b. # nun würde ich gern wissen, womit du gerechnet hast
	- c. nun würde ich gern wissen, womit du gerechnet hast
	- d. du hast erzählt, womit du nicht gerechnet hast

Als Fortsetzung von (d) weist nicht (b), sondern (c) einen Verum-Fokus auf; dort ist der Fokusexponent dieser Verbindung (die Präposition) betont. Wenn man die zur PR-Struktur führende Abtrennung und Rekonstruktion als quasi-syntaktischen Prozeß versteht, kann man möglicherweise syntaktische Gesetzmäßigkeiten in Anspruch nehmen, um zu deduzieren, daß die PR-Struktur von (96b) nicht die Form (96a) haben kann. In jedem Fall ist der Unterschied zwischen (96b) und (96c) nicht auf rein semantische Ursachen zurückzuführen.<sup>17</sup>

### **10.3 Nicht-segmentale Lokalisierung von VERUM**

Wenn wir die Annahme (91iii) jetzt wieder aufgreifen, ergibt sich, daß in der PR-Struktur (95) die isolierten Pronomen die Φ-Position einnehmen. Auf diese Repräsentation kann der Zuordnungsbegriff (61) so angewendet werden, daß aus der Betonung der Pronomen ein Verum-Fokus resultieren kann.

Obwohl (91iii) soweit erfolgreich ist, legen die oben angedeuteten Bedenken gegen diese Strukturannahme es nahe, nach einer Alternative zu suchen. Ich möchte einen Vorschlag zur Diskussion stellen, bei dem VERUM nicht segmental lokalisiert ist, sondern durch eine Übersetzungsregel generiert wird, die in bestimmter Weise strukturabhängig ist. Die Übersetzungsregel ist informell und vereinfacht in (97) angegeben.<sup>18</sup>

<sup>17</sup>Ebenso wie *womit* usw. verhalten sich ähnlich aufgebaute Elemente, z. B. *warum* (zu *darum*) und *weshalb* (zu *deshalb*). Es ist bemerkenswert, daß der RW-Verum-Fokus sich in dieser Hinsicht anders als Echofragen verhält. Echo-W-Fragen mit diesen Elementen müssen bekanntlich auf dem pronominalen ersten Bestandteil betont werden: *womit*, *warum*, *weshalb* usw.

<sup>18</sup>Explizitere Formulierungen von Übersetzungsregeln, die man analog zu (97) verstehen kann, finden sich bei Jacobs (1991); insbesondere wird dort " GILT" (= VERUM) in grundsätzlich ähnlicher Weise behandelt. – Bei der genauen Ausformulierung sind die Beobachtungen von Abschnitt 6 zu beachten: VERUM kann sich im Skopus aller Ausdrücke befinden, in deren Skopus sich das finite Verb befindet.

(97) *Einführung von VERUM* Gegeben sei eine syntaktische Struktur

bei der (a) *K<sup>i</sup>* die Form [σ Π σ] hat und σ phonologisch leer ist und (b) *K<sup>j</sup>* nicht phonologisch leer ist.

Dann ist *B (Kk)* = *B (Kj)* (VERUM (*B (Ki)*)).

(97) ist auf PR-Strukturen anzuwenden. Die Annahmen von (76) können alle weiter gelten, außer der Klausel (76vi), nach der Φ die Spezifikation [+VER] trägt; für das syntaktische Merkmal [VER] besteht jetzt keine Motivation mehr. Die Konstituente *K<sup>k</sup>* enthält kein phonologisches Material außer *K<sup>j</sup>* und Π (vgl. (76i)). Für die Füllung von *K<sup>j</sup>* gibt es 4 Möglichkeiten. (i) *K<sup>j</sup>* ist mit einer C-Partikel gefüllt, wie in (48a,b) sowie (77a) und (78a). (ii) *K<sup>j</sup>* ist mit einem R-/W-Pronomen gefüllt, wie in (95). Wenn wir (91ii) annehmen, enthält *K<sup>i</sup>* in diesem Fall ein phonologisch leeres Φ. (iii) *K<sup>j</sup>* ist mit einem finiten Verb gefüllt. Das finite Verb ist in der PR-Struktur 'rekonstruiert' im Sinne von Anm. 7 (ohne seine S-Struktur-Position zu räumen), so daß seine Übersetzung an der Stelle der von ihm gebundenen Spur wirksam wird (also zur Übersetzung von Π beiträgt). Daher ist *B (Kj)* in diesem Fall ausschließlich durch die semantischen Eigenschaften von Φ bestimmt. (iv) *K<sup>j</sup>* ist mit einer 'adverbialen' Konjunktion wie *wenn, obwohl, bevor, damit, …* gefüllt. Hierüber liegen nur begrenzte Untersuchungen vor (vgl. die Abschnitte 4.2f.). Wenn sich zeigt, daß die Betonung solcher Elemente generell nicht zu einem Verum-Fokus führt, können entsprechende Bedingungen für die Füllung von *K<sup>j</sup>* formuliert werden.

Um den Verum-Fokus zu generieren, muß der Zuordnungsbegriff von (61) wie in (98) modifiziert werden:

(98) *Zuordnung*

In einem Ausdruck α ist ein Bedeutungselement *BE* einer Konstituente *K<sup>h</sup>* 'zugeordnet' gdw.


10 Über Verum-Fokus im Deutschen

gilt, daß *B (Km) = B (Kh) (BE (B (K<sup>l</sup> )))*.

Die Idee bei (98ii) ist, daß *BE* ein Prädikat ist, das die Übersetzung von *K<sup>l</sup>* als Argument nimmt, wobei die Einführung dieses Prädikats durch die Schwester von *K<sup>l</sup>* ausgelöst wird. *BE* soll also – intuitiv einleuchtend – der Konstituente *K<sup>h</sup>* zugeordnet sein, die die Einführung von *BE* auslöst. Bei Betonung von *K<sup>h</sup>* kann dann *BE* als inhaltlich hervorgehoben aufgefaßt werden.

Nach dem Vorschlag (97) ist VERUM nicht segmental – d. h., nicht als Übersetzung einer Konstituente oder einer Merkmalspezifikation in einer Konstituente – lokalisiert. Eine solche Verletzung des Prinzips der strikten Kompositionalität ist weniger ungewöhnlich, als es scheinen mag. Es ist kaum vermeidbar, z. B. die Kennzeichnung eines Satzes als Deklarativsatz, direkter Interrogativsatz u. ä. auf ähnliche Weise zu generieren. Illokutionstyp-Operatoren (oder funktional ähnliche Elemente wie 'Satzmodus'-Markierungen) sind nicht segmental lokalisiert. Insofern kann man vermuten, daß die IT-Deutung von VERUM, obwohl sie falsch ist, doch auf einer korrekten Vorstellung fußt: auf einer nicht-segmentalen Lokalisierung dieses Bedeutungselements.

### **Literatur**



### **Chapter 11**

## **Vorangestellte Verben und Komplementierer sind eine natürliche Klasse**

Tilman N. Höhle

### **1 Einleitung**

Bei der Analyse von Sätzen mit vorangestellten Verben – d. h. mit Verbzweitoder Verberststellung im Deutschen usw. und mit 'Subjekt-Auxiliar-Inversion' im Englischen usw. – unterstellt man gewöhnlich, daß vorangestellte und nichtvorangestellte Verben kategorial nicht verschieden sind. Diese Annahme ist aus vielen Gründen naheliegend. Als Borsley (1989) vorschlug, (i) sie kategorial zu unterscheiden, und zwar (ii) so, daß vorangestellte Verben und Komplementierer eine natürliche Klasse sind, haben viele Leser (mich eingeschlossen) diesen Vorschlag deshalb als abwegig empfunden.

Allerdings hat Hudson (1977: 79) beobachtet, daß viele Sprecher des Englischen die Verbform *aren't* genau dann bei einem Subjekt *I* gebrauchen, wenn das Verb vorangestellt ist, und Borsley (1989: 857) weist korrekt darauf hin, daß das deskriptive Problem, das darin liegt, eine einfache Lösung findet, wenn das vorangestellte *aren't* kategorial verschieden ist von dem *aren't* in Basisposition. Trotzdem zögert man gewöhnlich, aus diesem Vorkommen von *aren't* sehr weitreichende Schlüsse zu ziehen; zum einen, weil man sich vorstellt, eine weniger radikale Lösung des Problems finden zu können, zum andern, weil dieser Fall völlig singulär zu sein scheint. Dieser Eindruck ist jedoch falsch. In den Abschnitten 2

<sup>§</sup>*Anmerkung der Herausgeber:* Diese Arbeit wurde erstmals veröffentlicht in Dürscheid, Christa, Ramers, Karl-Heinz & Monika Schwarz (Hrsg.). 1997. *Sprache im Fokus. Festschrift für Heinz Vater zum 65. Geburtstag*, 107–120. Tübingen: Niemeyer. Editorische Eingriffe in den Wiederabdruck beschränken sich auf Anpassungen an das einheitliche Bandformat.

Tilman N. Höhle. 2019. Vorangestellte Verben und Komplemen- tierer sind eine natürliche Klasse. In Stefan Müller, Marga Reis & Frank Richter (Hrsg.), *Beiträge zur deutschen Grammatik. Gesammelte Schriften von Tilman N. Höhle. Zweite durchgesehene Auflage*, 417–433. Berlin: Language Science Press. DOI:10.5281/zenodo.2588367

und 3 betrachten wir zwei (wohlbekannte) Klassen von Daten, die von der gleichen Art sind und ganz offenkundig eine radikale Überprüfung herkömmlicher Annahmen nötig machen.

Die Formen der Verben in Abschnitt 3 sind sensitiv dafür, ob das vorangestellte Verb vor dem eigenen Subjekt oder danach steht. Dieselbe Sensitivität findet sich auch bei Komplementierern in Abschnitt 4. In dieser Hinsicht sind Komplementierer und vorangestellte Verben eine natürliche Klasse (unabhängig davon, ob man Borsleys Vorschlägen im Detail folgen möchte oder nicht).

In diesem Beitrag geht es mir ausschließlich darum, diesen Gedanken anhand von Fakten intuitiv verständlich zu machen. Die Darstellung ist deshalb so informell und hinsichtlich technischer Details so unbestimmt gehalten, wie es irgend möglich erschien.

### **2 Ersatzimperativ**

In großen Bereichen des Niederdeutschen gibt es eine besondere Form der asymmetrischen Koordination wie in (1), wo ein infinites Verb am Anfang des zweiten Konjunkts steht:

	- b. er möchte herantreten und [nehmen sich etwas] (Fuckel 1912: 165)
	- c. dann wollte ich mir eine Stube mieten und [verheiraten mich]

(Teuchert 1921: 76)

Dieselbe Konstruktion ist im Süden des niederländischen Gebiets üblich, s. (2a) (vgl. auch Goossenaerts 1956–1958: xcii); ebenso im Norden, s. (2b):

	- b. doe du mos mußt ais mal kommen kommen en und [zain(en) [sehen ons unser vooltje] Fohlen]

(Veldman 1991: (101a))

Bei Huygens (17. Jh.) finden sich zahlreiche dialektale und schriftsprachliche Belege dieser Art (Hermkens 1987: 169ff.). Die Konstruktion ist auch im Nordfriesischen (Hermann 1938: 121f.) und älteren Westfriesischen (van der Meer 1989) geläufig. (Nach Behaghel (1903: 448f.) ist sie bereits im Heliand etabliert. Angesichts der großen Wortstellungsfreiheiten im Heliand ist diese Annahme jedoch überprüfungsbedürftig.)

Im heutigen Westfriesischen nun ist der vorangestellte Infinitiv durch den Imperativ ersetzt (oft als imperativus pro infinitivo bezeichnet):

11 Vorangestellte Verben und Komplementierer

	- b. de die plysje Polizei soe wird bij zu him ihm komme kommen en und [nim/\*nimme [nimm syn seine papieren Papiere mei] mit] (Haan 1990: (9))

In der normalen symmetrischen Koordination (3a) kann nur der Infinitiv *nimme* auftreten; in der asymmetrischen (3b) muß das infinite Verb die Imperativform *nim* haben.<sup>1</sup> Wie beim englischen *aren't I* haben wir hier eine Verbform, die zwar aus dem allgemeinen Inventar der Verbformen bekannt ist, die aber in dieser syntaktischen Umgebung vollkommen unerwartet ist. Der Umstand, vorangestellt zu sein, hat historisch ausgereicht, daß statt des systematisch zu erwartenden Infinitivs sich in dieser Position eine Verbform (Imperativ) etabliert hat, die normalerweise mit gänzlich anderen semantischen und pragmatischen Eigenschaften assoziiert ist. Das heißt, daß ein vorangestelltes Verb nicht nur andere zeitliche Ordnungsbeziehungen mit dem Rest des Satzes eingeht als ein Verb in Basisposition. Das vorangestellte Verb muß darüber hinaus (partiell) andere grammatische Eigenschaften haben, mit denen sich eigene morpho-phonologische Eigenschaften assoziieren können.

### **3 Inversionsformen**

Im Altenglischen endet der Plural von Verben, die auf ihr Subjekt folgen, im Indikativ Präsens einheitlich für alle Personen auf -*að*; im Optativ des Präsens und im ganzen Präteritum endet er auf -*Vn*. Dabei ist die Identität des Vokals (*a, o, u, e*) von der Flexionsklasse, dem Tempus und dem Modus bestimmt. Der Imperativ 2. Plural endet normalerweise auf -*að*, der 'Imperativ' 1. Plural auf -*an*. Bei vorangestellten Verben gilt eine zusätzliche Regularität:

Folgt bei invertierter Wortstellung auf eine beliebige 1. oder 2. Plur. das zugehörige Personalpronomen *we*, *wit* bzw. *ȝe*, *ȝit*, so stehen öfters an Stelle der vollen Personalendungen […] verkürzte Formen auf *-e*, z. B. *binde we*, *wit* bzw. *ȝe*, *ȝit* als Ind. Opt. und Imp. Präs., *bunde we*, *ȝe* als Ind. Opt. Prät. (Brunner 1965: 276)

<sup>1</sup>Neben dieser koordinierenden Konstruktion gibt es im Westfriesischen, im Nordfriesischen und im Schleswiger Niederdeutschen (aber nicht im Nordniederländischen) auch eine ähnliche subordinierende Konstruktion. Darauf gehe ich hier nicht ein.

(*We* und *ȝe* sind Plural, *wit* und *ȝit* sind Dual.) Da der Stamm bei einigen dieser kurzen Inversionsformen Umlaut aufweist, hat man versucht, sie auf frühere Optativformen zurückzuführen (Brunner 1965: 277). Auch wenn das korrekt ist, bleiben immer noch zwei Fragen. Der Ausfall des Nasalkonsonanten vor den Pronomen der 1. und 2. Person und die Reduktion des Vokals zu *-e* sind keine regulären phonologischen Prozesse. Und wie soll man verstehen, daß eine Optativform sich etabliert, wo distributionell eine Indikativform zu erwarten wäre? Es ist offensichtlich, daß hier dieselbe Situation wie bei *aren't I* und beim friesischen Ersatzimperativ vorliegt: Das vorangestellte Verb ist seiner grammatischen Natur nach so verschieden von dem entsprechenden Verb in Basisposition, daß es fähig ist, eigene Form- und Kombinationscharakteristika zu tragen.

Die gleiche Situation wie im Altenglischen liegt im Mittelniederdeutschen vor. In den verschiedenen Gebieten herrscht gewöhnlich der Einheitsplural, und zwar teils auf *-t*, teils auf *-n*. " Vor den nachgestellten Pronomina *wi*, *gi* geht die Verbalform meist auf *-e* aus: *hebbe wi, hebbe gi*" (Sarauw 1924: 146). Die Grundzüge dieses Systems haben sich bis in jüngere niederdeutsche und ostniederländische Dialekte hinein gehalten. Das jüngere Mecklenburgische hat z. B. (überwiegend) einen Einheitsplural auf *-en*, und für die Inversion gilt: " Die Endung *en* in 1. und 2. Pers. Plur. apokopirt ihr *n*, wenn das Subjectspronomen nachfolgend inclinirt" (Nerger 1869: 156).

Im Dialekt von Vriezenveen (Overijssel, Ostniederlande; s. Entjes 1970: 317– 319) gibt es im Präsens einen Einheitsplural auf -*t* wie in (4a):

(4) a. wii/ii/zii kiikt

'wir/ihr/sie kucken/kuckt'


Die 2. Plural – die genauso auch im Singular gebraucht werden kann – hat die Inversionsform (4b), also ohne Suffix. Das ist soweit wie bei der 2. Singular Präsens des Standard-Niederländischen: *jij bent* 'du bist' gegenüber *ben jij*. Die 1. Plural hat die Inversionsform (4c), also auf -*en*. Das Präteritum der starken wie der schwachen Verben hat einen Einheitsplural auf -*en* wie in (5a):

(5) a. wii/ii/zii bjeten

'wir/ihr/sie bissen/bißt'


### 11 Vorangestellte Verben und Komplementierer

Bei den starken Verben ist die Inversionsform der 2. Plural (5b) wieder suffixlos; die 1. Plural (5c) hat wie die Inversionsform des Präsens (und wie die nicht-invertierte Form) -*en*. Die schwachen Verben haben im Präteritum keine besonderen Inversionsformen.

Gegenüber dem mittelniederdeutschen Zustand ist das Inversionssystem im Detail also erheblich umgestaltet. Bei einigen Verben gibt es irreguläre Inversionsformen; z. B. zum Plural Präsens *zeent* des Verbs 'sein' in der 2. Person die Form *ziij* 'seid ihr' (Entjes 1970: 335). Auffällige irreguläre Inversionsformen zeigt auch z. B. das Niederdeutsche von Assenhausen (Sauerland):

(6) a. eiː dot/krit ̯ (Grimme 1910: 85)

'ihr tut/kriegt'


Die Beispiele für – im Detail erheblich variierende – Inversionsformen besonders in niederländischen Dialekten lassen sich leicht vermehren. Die Existenz von Verbformen, die für ihre Position relativ zum Subjekt sensitiv sind, ist jedoch nicht auf den Bereich des Niederdeutschen und seiner engen Verwandten beschränkt. Das Althochdeutsche hat für die 1. Plural Präsens Indikativ ursprünglich die Endung *-mes*. Seit dem 9. Jh. tritt daneben *-n* auf, das die ältere Endung bis zum 11. Jh. verdrängt. Während der Koexistenz der beiden Endungen ist ihr Verhältnis zueinander im Allgemeinen unübersichtlich. Aber im Tatian scheint es klar zu sein (Eggenberger 1961: 104–108): *-mes* kommt nach dem Subjekt vor, aber nicht vor dem Subjekt; *-n* kommt vor und nach dem Subjekt vor.

Bereits im Althochdeutschen kommt anstelle von *-n* auch die entsprechende Verbform ohne Nasalkonsonant vor, wenn das Subjektpronomen der 1. Plural unmittelbar folgt (Gering 1888: 249); im Mittelhochdeutschen ist diese konsonantenlose Inversionsform völlig geläufig (Paul 1989: 242). (Dies kann hier ebensowenig wie im Altenglischen auf eine allgemeine phonologische Gesetzmäßigkeit zurückgeführt werden.)

### **4 Komplementierer**

In den skandinavischen Sprachen tritt die Partikel *som* in drei Umgebungen/ Funktionen auf: Sie leitet Vergleichsausdrücke ein, sie leitet Relativsätze ohne explizite Relativ-Phrase ein, und sie tritt im Anfangsbereich von eingebetteten *w*-Interrogativsätzen (und freien Relativsätzen) auf.

Das Vorkommen von *som* in Relativsätzen ist in (7) und (8) für das Norwegische illustriert (Taraldsen 1986: 149); die Lage im Schwedischen ist genau entsprechend (Andersson 1975: 157).

	- b. (vi kjenner den mannen) [Marit snakker med *t*]

Man kann die Eigenschaften dieser Konstruktion dadurch erfassen, daß man verschiedene Relativsatz-Komplementierer annimmt, die jeweils (partiell) individuelle Eigenschaften haben. Wenn man außerdem phonologisch leere Relativphrasen annimmt, sieht die Struktur der Relativsätze schematisch so aus:<sup>2</sup>


iii. RP [ *e* [<sup>S</sup> Marit snakker med *t* ] ] zu (8b)

Der leere Relativsatz-Komplementierer in (9iii) ist darauf festgelegt, als Spezifizierer eine leere Relativphrase (RP) und als Komplement eine gesättigte Verbprojektion (S) zu sich zu nehmen, die (irgendwo) eine Lücke enthält, die nicht das Subjekt von S ist. *Som* kann mit denselben Eigenschaften auftreten wie in (9ii), kann aber auch wie in (9i) statt des S mit Lücke eine Verbprojektion ohne Lücke zu sich nehmen, der das Subjekt fehlt (VP). Die beiden Varianten von *som* und der leere Komplementierer sind kategorial gleich; dementsprechend sind die Relativsätze in (7) und (8) kategorial gleich.

Das Englische hat den gleichen leeren Relativsatz-Komplementierer und einen Relativsatz-Komplementierer *that*, der genau die Eigenschaften der *som* von (9i) und (9ii) hat.

Eingebettete polare Interrogativsätze werden durch *om* eingeleitet, *daß*-Sätze durch *at* o. ä. Keins von beiden tritt in *w*-Interrogativsätzen auf. Dort treten jedoch *som* und ein leerer Interrogativsatz-Komplementierer auf, die im Schwedischen ganz ähnlich verteilt sind wie bei den Relativsätzen (Andersson 1975: 157):

<sup>2</sup>Diese Annahmen sind gedanklich nicht notwendig (obwohl sie vielleicht korrekt sind). Ich benutze sie hier in erster Linie aus expositorischen Gründen. Die Idee, den Unterschied zwischen (7a) und (8a) wie in (9i) gegenüber (9ii) zu analysieren, ist durch Pollard & Sag (1994: Kap. 5.2.2) angeregt.

### 11 Vorangestellte Verben und Komplementierer


Für das Norwegische gelten völlig entsprechende Beobachtungen, nur daß dort Konstruktionen wie (11a) unakzeptabel sind (Taraldsen 1986: 150). Dem Norwegischen fehlt die in (12ii) aufgeführte Variante von *som*.

Die Daten in (10) sind in zweifacher Hinsicht äußerst bemerkenswert. Zum einen ist es bemerkenswert, daß *som* obligatorisch ist, wenn die *w*-Phase das Subjekt des Interrogativsatzes ist (d. h., daß es keinen leeren Interrogativsatz-Komplementierer gibt, der VP als Komplement zu sich nimmt). So etwas wie eine (erfolgreiche) Erklärung dafür ist nicht bekannt; wir können und müssen nur konstatieren, daß das gleiche für Relativsätze mit leerer Relativphrase im Skandinavischen und im Englischen gilt.

Zum andern ist es sehr bemerkenswert, daß (10a) im Schwedischen überhaupt möglich ist. In Parallele zu (12ii) wäre es zunächst naheliegend, für (10a) eine Struktur wie in (13) anzunehmen:

(13) vem [ som [<sup>S</sup> *t* köpte hans gamla bil ] ]

Im Standard-Schwedischen kann das Subjekt eines eingebetteten Satzes jedoch nicht lang extrahiert werden, wenn der Satz eine phonologisch explizite Einleitung hat (Engdahl 1980: 105):

	- b. \* Krig Krieg och und Fred Frieden minns erinnere jag ich inte nicht om ob *t* har ist översatts übersetzt.worden till in esperanto Esperanto

Wenn man die Struktur (13) annimmt, muß man für kurze Extraktionen ganz andere Gesetzmäßigkeiten annehmen. Dieselbe Überlegung gilt für (7a) und entsprechende englische Relativsätze mit *that*. Die Strukturierung in (12i) und (9i) ist eine Alternative, bei der der Komplementierer ähnliche Eigenschaften hat wie ein Verb (z. B. engl. *tend*), das Subjekt-zu-Subjekt-Anhebung auslöst.

### **5 Relativsätze zu nicht-dritter Person**

Die Annahmen über Komplementierer, die in (9) und (12) angedeutet sind, legen eine Möglichkeit nahe, Relativsätze wie (15) zu analysieren:

	- b. (mir) die ich euch so gerne besuche
	- c. (liebe Freundin) die du uns so gerne besuchst!
	- d. (Ihnen) der Sie uns so gerne besuchen

Im Unterschied zu anderen Relativsatztypen enthält dieser keine Lücke. Er ist nur möglich, wenn das Bezugsnominal funktional nicht-dritte Person ist, d. h. den Sprecher oder den/die Angesprochene(n) bezeichnet (z. B. beim Vokativ in (15c)) und denselben Referenten wie das Subjekt hat. Das Relativpronomen und das Nominal stimmen bzgl. natürlichem Sexus und natürlicher Zahl überein (aber nicht notwendig bzgl. Numerus, s. (15d)). Dieses komplexe System von Übereinstimmungen kann durch die Eigenschaften eines besonderen Relativsatz-Komplementierers gesichert werden, der in Konfigurationen wie (16) eintritt:

### (16) RP [ *e* S ]

Dieser Komplementierer stimmt mit denen von (9ii,iii) und (12ii,iii) überein, insofern er S (eine gesättigte Verbprojektion) als Komplement zu sich nimmt; er stimmt mit denen von (9i) und (12i) überein, insofern dieses Komplement keine Lücke enthält.

Um die Eigenschaften des Subjekts von S sicherzustellen, muß es für den Komplementierer zugänglich sein. Daß dies nötig ist, ergibt sich auch unabhängig aus einer Beobachtung von van Haeringen (1958). In vielen Dialekten tragen Komplementierer Endungen, die mit dem Subjekt kongruieren. Gewöhnlich sind diese Endungen gleich den Endungen des finiten Verbs im selben Satz. In den Dialekten jedoch, die besondere Inversionsformen wie in (4) haben, tragen die Komplementierer Endungen, die denen von invertierten Verben entsprechen.<sup>3</sup> So findet man in Dedemsvaart (Overijssel; s. van Haeringen 1958: 119) Daten wie (17):

<sup>3</sup>Zwart (1993: Kap. III.3) erörtert die Schwierigkeiten solcher Daten für eine 'minimalistische' Theorie.

11 Vorangestellte Verben und Komplementierer

(17) a. azze daß-e wy wir de den törf Torf niet nicht verkoopn verkaufen kunt können b. as(\*ze) zy de törf niet verkoopn kunt

Der Dialekt hat den Einheitsplural auf -*t*, deshalb heißt sowohl beim Subjekt *wy* 'wir' in (17a) als auch beim Subjekt *zy* 'sie' in (17b) das finite Verb *kunt*. Da es in der 1. Plural eine Inversionsform auf -*e* gibt, hat der Komplementierer in (17a) die Form *azze*; und da es in der 3. Plural keine eigene Inversionsform gibt, hat er in (17b) die 'unflektierte' Form *as*. Offenbar hat der Komplementierer unabhängig vom finiten Verb Zugang zum Subjekt. Ich nehme an, daß derselbe Mechanismus die nicht-lokale Subjekt-Verb-Kongruenz in Konstruktionen wie (18) ermöglicht:

(18) a. [die Hände gezittert] haben/\*hat ihm diesmal nicht b. wenn ihm wieder anfangen/\*anfängt [die Hände zu zittern]

### **6 Vorangestellte Verben**

Parellel zur Struktur von Sätzen mit Komplementierern wie in (9), (12) und (16) kann man Sätzen mit vorangestelltem Verb (" vv") folgende schematische Analyse geben:

(19) i. XP [ vv VP ] ii. vv VP iii. XP [ vv [<sup>S</sup> … *t* … ] ] iv. XP [ vv S ] v. vv S

(19i) und (19ii) sind Schemata für vorangestellte Verben, die ein Subjekt selegieren, aber nicht vor diesem Subjekt stehen. Unter (19i) fallen z. B. die Verben in (4a), (5a) und (6a), wenn sie nicht in Basisposition stehen. Diese Struktur ist parallel zu (9i) und (12i); der Spezifizierer XP ist das Subjekt. Unter das spezifiziererlose Schema (19ii) fallen Konjunkte mit vorangestellten infiniten Verben wie in (1), (2) und (3b).

(19iii-v) sind Schemata für vorangestellte Verben, die vor einer gesättigten Verbprojektion stehen, die also vor dem Subjekt des Satzes stehen, sofern der Satz eine Subjektkonstituente hat. Darunter fallen z. B. die Verben in (4b,c), (5b,c) und (6b). Die Kongruenz mit dem Subjekt beruht in diesen Fällen auf demselben Mechanismus wie in (17) und (18). (19iii) ist parallel zu (9ii,iii) und (12ii,iii); die Lücke *t* ist nicht das Subjekt des Satzes.

Nach dieser Analyse bindet das Subjekt eines Verbzweitstellungssatzes keine non-A-Spur, wenn es in seinem Vorfeld steht. Diese Annahme erleichtert es, die Verteilung von Inversionsformen zu erfassen, und sie ist durch die Parallele mit den Komplementierern gestützt. Und wie bei den Komplementierern legt der auffällige Unterschied zur langen Subjektextraktion eine solche Analyse unmittelbar nahe. Zwar kann das Subjekt eines eingebetteten Satzes im Prinzip lang extrahiert werden, wie in (20a):

	- b. ? dein Bruder finde ich, daß mir wirklich einen Gefallen schuldet
	- c. \* man meint sie, daß sich mehr um seine Eltern kümmern sollte
	- d. \* es glaube ich, daß schon lange keine Saurier mehr gibt

Das ist aber stark beschränkt, und auch Sprecher des Deutschen, die lustvoll lang extrahieren, tun dies z. B. mit *man* (20c) und semantisch leerem *es* (20d) überhaupt nicht.

Verben, die die Position vv in (19) besetzen, sind kategorial gleich, jedenfalls dann, wenn ein Spezifizierer XP vorhanden ist, also in (19i), (19iii) und (19iv). Das ergibt sich aus der Parallele mit Komplementierern, und es bestätigt sich durch die einheitliche Distribution von Verbzweitstellungssätzen. Die spezifiziererlose Struktur (19v) für Verberststellungssätze ist parallel zu einfachen Komplementierern wie *daß* u. ä.; vgl. (17).

(19iv) ohne Lücke in S ist parallel zu (16). Diese Konfiguration ist im Deutschen durch Konstruktionen mit 'Vorfeld-*es*' belegt:

	- b. es sollte mal wieder über Orthographie diskutiert werden

Wie in (15) ist die erste Konstituente des Satzes (die Relativphrase in (15) und das *es* in (21)) 'expletiv' in dem Sinn, daß sie keinen eigenen Bedeutungsbeitrag leistet. Es gibt auch keine allgemeinen (von diesen Konstruktionen unabhängigen) Regularitäten, nach denen das Auftreten dieser Konstituenten zusammen mit den anderen Teilen des Satzes überhaupt möglich wäre. Und wie in (15) gibt es eigentümliche Beschränkungen hinsichtlich des Subjekts: Unbetonte Personalpronomen und *man* sind strikt unmöglich; unbetonte definite Nominalphrasen und besonders Eigennamen sind im Allgemeinen schlecht, aber nicht strikt unmöglich.

Bei vorangestellten Verben (wie bei Komplementierern) fungiert die davorstehende Konstituente XP formal einheitlich als Spezifizierer. Das erlaubt es, die

### 11 Vorangestellte Verben und Komplementierer

'Vorfeld-Ellipse' in Fällen wie (22) einheitlich als Ellipse bzw. phonologisch leere Besetzung des Spezifizierers zu verstehen:

	- b. \_\_ weiß doch jeder
	- c. \_\_ gibt schon lange keine Saurier mehr
	- d. \_\_ hat noch niemand angerufen

Während in (22a) und (22b) ein Spurbinder ausgelassen ist, ist in (22c) das Subjekt ausgelassen, das nach (19i) keine (non-A-)Spur bindet. Und (22d) kann – in manchen Kontexten: muß – man genau so wie (21a) verstehen, d. h. hier ist das Vorfeld-*es* ausgelassen. Nach manchen Vorstellungen über dieses *es* wäre das ganz unbegreiflich; wenn (22) unter (19iv) mit XP und ohne Lücke in S fällt, ist es kein Problem.

Diese Annahmen erlauben es vielleicht auch, die Vorfeld-Ellipse mit der Auslassung von Subjekten im Englischen zu parallelisieren:

	- b. \_\_ didn't respond

In (22) und in (23) ist eine Spezifizierer-Position unbesetzt, unabhängig davon, ob sie in einem herkömmlichen Sinn eine 'A-Position' ist oder nicht.

### **7 Variationen: Bantu**

Fakten der betrachteten Art gibt es nicht nur in germanischen Sprachen. Die keltischen Sprachen z. B. sind bekannt dafür, daß vorangestellte Verben und Komplementierer oft intime Beziehungen eingehen. Es ist weniger geläufig, daß in einigen Bantu-Sprachen interessante Variationen desselben Themas zu beobachten sind.

Im Duala gelten für sog. unerweiterte (oder 'kurze') Relativsätze, 'Topikalisierungs'-Strukturen und *w*-Interrogativsätze mit vorangestellter *w*-Phrase weitgehend gleiche Gesetzmäßigkeiten. ('Erweiterte' Relativsätze lasse ich beiseite.) Diese drei Satztypen fasse ich als 'X-Sätze' zusammen (mit " X" für 'Extraktion'). Die Gesetzmäßigkeiten für X-Sätze betreffen phonologische Erscheinungen und Affixe am Verb. Ittmann (1939: 81f.) faßt den Kern dieser Phänomene unter dem Titel 'Relativmodus' zusammen und unterscheidet Relativmodus I (gewisse tonologische und segmentale Modifikationen des Verbs) und Relativmodus II (Antritt von -*nɔ* ans Verb).

Die einschlägigen Gesetzmäßigkeiten kann man so zusammenfassen:

	- ii. Ein Verb V steht im Relativmodus I gdw. V das (oberste) Verb eines X-Satzes (oder ein davon regierter Infinitiv) ist, in dem das Subjekt von V voransteht.
	- iii. Ein Verb V hat nur dann anstelle des Subjekt-Präfixes ein 'Relativ-Präfix', wenn V das (oberste) Verb eines X-Satzes ist, in dem das Subjekt von V
		- a. eine phonologisch leere Relativphrase ist (obligatorisch), oder
		- b. eine *w*-Phrase ist (fakultativ).

Bei der Extraktion in (24i) gibt es keinen Unterschied zwischen Komplementen und Adjunkten oder zwischen kurzer und langer Extraktion. Der Gebrauch des 'Relativ-Präfixes' in *w*-Interrogativsätzen in (24iiib) erinnert natürlich unmittelbar an das skandinavische *som*.

Die Wirkung von (24i) ist in (25b) und (26) zu sehen:


dieses Auto foc Frau-meine sie-prät-nɔ sie-woll(en) daß ich-kaufe 'dieses Auto wollte meine Frau, daß ich kaufe' (Epée 1976: 231 (71))

In (25a) steht *nja* 'wer' als Subjekt des eingebetteten Satzes in situ; in (25b) ist es lang extrahiert, und das Matrixverb steht im Relativmodus II: Es hat das Suffix -*nɔ*. In (26) ist das Objekt des eingebetteten Satzes (*mun motowa*) lang 'topikalisiert', und das oberste (Hilfs-)Verb des Matrixsatzes (*ta* 'Präteritum') hat wiederum *-nɔ*. (Die eingebetteten Verben tragen n. b. kein *-nɔ*.)

Die Wirkung von (24iiib) ist in (27) zu sehen:


### 11 Vorangestellte Verben und Komplementierer

In (27a) steht das normale Subjekt-Präfix *a*, in (27b) statt dessen das 'Relativ-Präfix' *nu*, jeweils in Kongruenz mit dem Subjekt. Bei dem Präfix *lo* in (28a) kann man nicht erkennen, ob es ein Relativ-Präfix ist; Subjekt- und Relativ-Präfix sind bei den meisten Nominalklassen homophon:

(28) a. njika welche lonɔn Vögel lo-ma-lɔngε̆ sie/die-präs-singen idiba? morgens (Epée 1976: 238 (78b)) 'welche Vögel singen morgens?' b. \* njika lonɔn lo-ma-lɔ́ngɔ́idiba? (Epée 1976: 238 (78c))

Aber da das Subjekt des Interrogativsatzes eine *w*-Phrase ist, muß hier gemäß (24ii) auf jeden Fall der Relativmodus I am Verb auftreten mit -*ε̆* anstelle des normalen -*ɔ́*.

Man erkennt hier dieselbe scharfe Unterscheidung zwischen voranstehendem Subjekt des Satzes und extrahierten Nicht-Subjekten wie in den Abschnitten 3 und 4. Schematisch:

(29) i. ZP [ *e* VP ] ii. ZP [ *e* [<sup>S</sup> … *t* … ] ]

Dabei ist die ZP eine topikalisierte Phrase, eine interrogative *w*-Phrase oder eine phonologisch leere Relativphrase. Das (oberste) Verb in der VP von (29i) steht im Relativmodus I, und sein Subjekt-Präfix ist gegebenenfalls durch das Relativ-Präfix ersetzt. Die Lücke in (29ii) ist nicht das Subjekt von S, und das (oberste) Verb von S steht im Relativmodus II. Diese Eigenschaftem des (obersten) Verbs sind für den leeren Komplementierer zugänglich, wenn VP und S Projektionen von V sind und die Subjekt-/Relativ-Präfigierung sowie die 'Relativmodi' Head-Eigenschaften sind.

Wie das Duala verhalten sich auch einige eng verwandte Nachbarsprachen (Guthrie 1953: 22). Außerhalb dieser Gruppe scheint das System der beiden Relativmodi nicht verbreitet zu sein. Aber 'Relativ-Affixe' am Verb und ihr Gebrauch auch in *w*-Interrogativsätzen sind weit verbreitet. Bei Aufbau und syntaktischem Gebrauch finiter Verbformen variieren wenige Hauptfaktoren; aus der Kombination verschiedener Variationswerte resultiert ein breites Spektrum einzelsprachlicher Systeme mit auffälligen Gemeinsamkeiten einerseits und erheblichen Detailunterschieden andererseits. Dabei sind Relativaffixe am Verb im typischen Fall mit Voranstellung des Verbs verbunden. Zu diesen Sprachen gehören unter anderem das Swahili, das Kihung'an und das Dzamba.

Im Swahili wird dem Verb eines (kurzen) Relativsatzes zu seinen normalen Affixen ein Relativ-Affix hinzugefügt, das mit der leeren Relativphrase kongruiert, und das Verb wird an den Anfang des Satzes vorangestellt. Das Kihung'an ist

dem Swahili soweit ähnlich. Es erlaubt jedoch außerdem in w-Interrogativsätzen ein Relativ-Präfix, und in dem Fall wird das Verb vorangestellt. (s. Takizala 1973: 140f.).

Im Dzamba wird das Verb einer Topikalisierungsstruktur und eines (kurzen) Relativsatzes vorangestellt. In beiden Fällen kongruiert es mit der topikalisierten Phrase bzw. der leeren Relativphrase mittels des normalen 'Subjekt-Präfixes'; im Relativsatz außerdem mittels eines zusätzlichen 'Relativ-Präfixes'. Wie Relativsätze verhalten sich auch gewisse *w*-Interrogativsätze. (Die Voranstellung tritt also ziemlich genau da auf, wo im Duala ein Relativmodus auftritt.) Die Kongruenz mit dem eigentlichen Subjekt geht dabei gegebenenfalls verloren. Ein Beispiel für einen Relativsatz:

(30) a. i-zi-bata die-Ente [í-zi-eza-aki der-ihr-geb-prät o-mama die-Mutter i-lo-so] den-Reis zi-kei sie-ging.weg (Bokamba 1980: (23b))

'die Ente, der die Mutter den Reis gab, ging weg'

b. o-mama die-Mutter a-eza-aki sie-geb-PRÄT i-zi-bata der-Ente lo-so Reis (Bokamba 1980: (22a))

Das Subjekt des Relativsatzes ist *o-mama*, und normalerweise kongruiert das Verb mittels des 'Subjekt-Präfixes' *a* damit, wie in (30b). In (30a) ist das Verb jedoch im Relativsatz vorangestellt.; das 'Relativ-Präfix' *í* kongruiert mit der leeren Relativphrase (die dieselben Kongruenzeigenschaften wie das Bezugsnominal hat), und das 'Subjekt-Präfix' *zi* kongruiert hier ebenfalls damit (und nicht mit dem Subjekt). Die Schemata für die vorangestellten Verben:

(31) i. ZP [ vv VP ] ii. ZP [ vv [<sup>S</sup> … *t* … ] ]

Im Unterschied zu den vorangestellten Verben in Abschnitt 3 hat das vorangestellte Verb in (31ii) keinerlei Kongruenz mit dem Subjekt von S. Aber ähnlich wie in Abschnitt 3 unterliegt es einer vom Normalfall (in der Basisposition) abweichenden besonderen Kongruenzregel.

### **Literatur**

Andersson, Lars-Gunnar. 1975. *Form and function of subordinate clauses* (Gothenburg monographs in linguistics 1). Göteborg: University of Göteborg, Dept. of Linguistics.


### **Chapter 12**

## **The** *w***-…** *w***-construction: Appositive or scope indicating?**

Tilman N. Höhle

### **1 Historical background<sup>∗</sup>**

In the field of linguistic activities that I have been associated with, the *was*- … *w*construction was established as a topic of interest through certain bold remarks made by Thilo Tappe during an RDGG meeting<sup>1</sup> in January 1980 (see (16) below). A variant of Tappe's idea became widely known through Riemsdijk's correspondence paper (Riemsdijk 1982). Over the years, informal discussions of the properties of the construction and aspects of its analysis were taken up sporadically, partly during RDGG meetings, partly in personal communications. Luckily,

<sup>1</sup> For information about the RDGG (Recent Developments in Generative Grammar) interest group, which was founded on the initiative of Jan Koster and Craig Thiersch, see Toman (1985: ix).

Tilman N. Höhle. 2019. The *w*-… *w*-construction: Appositive or scope indicating? In Stefan Müller, Marga Reis & Frank Richter (eds.), *Beiträge zur deutschen Grammatik. Gesammelte Schriften von Tilman N. Höhle. Second revised edition*, 435–460. Berlin: Language Science Press. DOI:10.5281/zenodo.2588369

<sup>§</sup> *Editors' note:* This contribution was originally published in Lutz, Uli, Müller, Gereon & Arnim von Stechow (eds.). 2000. Wh-*scope marking* (Linguistik Aktuell/Linguistics Today 37), 249– 270. Amsterdam: Benjamins. (A previous, largely identical version can be found in Lutz, Uli & Gereon Müller (eds.). 1996. *Papers on* wh-*scope marking* (Arbeitspapiere des Sonderforschungsbereichs 340, Bericht Nr. 76), 37–58. Universität Stuttgart/Universität Tübingen.) The layout and citation style have been adapted to the format chosen for the present volume.

<sup>∗</sup>The text that follows is a reconstruction of talks held in 1989 and 1990. It closely follows Höhle (1989a), with a few additional observations taken from Höhle (1989b); see the references. (Höhle 1990 was mainly an abridged version of Höhle 1989b.) Sections 8ff. and the notes have been added in February 1996. [A few rough passages have been smoothed down in 1999.] I am grateful to Gereon Müller for encouraging me to orally present major portions of this on December 1, 1995.

many of the results found their way into *Bausteine* (Stechow & Sternefeld 1988: 354ff., 374f., 384f., 393, 400). Somewhat surprisingly, though, none of these authors felt a need to defend their assumption that *was* is a scope indicator against the traditional assumption that the construction is appositive in nature (see (15)).<sup>2</sup> But at last, this issue came up during a conference in November 1987 when É. Kiss presented her view of a similar construction in Hungarian (see (7) below). Her view met with criticism from more than one side. Some discussants argued for the traditional view, while I tried to argue for Tappe's idea on the basis of the closely related *w*-P … *w*-P constructions (Section 5). The present article is an attempt to assess the plausibility of each idea.

### **2 Variant I:** *Was … w***-P – initial observations**

Consider the unembedded example (1) and its paraphrases in (2):

	- a. Wer, who, glaubst think du, you, hat has Recht? right
	- b. Was what glaubst think du*\*; you; wer who hat has Recht? right
	- c. Was what glaubst think du you hinsichtlich wrt. der the Frage question / darüber, there.about wer who Recht right hat? has
	- d. Wer who glaubst think du, you daß that Recht right hat? has

Given that the paraphrases differ syntactically, it is natural to ask whether any of them might be structurally related to (1) in some way.

The analysis of (2a) is controversial. It is either a parenthetical construction or an extraction from an embedded F2 clause (i.e., from a clause with a finite verb in second position). On either analysis, there is no similarity to (1).

<sup>2</sup>To be sure, McDaniel (1986) did provide specific reasons for her analysis, see Section 11. But her work was not generally known here at that time. I came to know it only while preparing for Höhle (1989a), and made no attempt to do justice to its empirical observations and theoretical proposals.

12 The *w*-… *w*-construction

The analysis of (2b), again, is not perfectly clear. But the fall of the intonation after *du* and the position of *hat* between *wer* and *Recht* are best taken as indications that this is a sequence of two complete clauses, none of which is embedded in the other. (1) differs from (2b) in both respects.

In (2c), *was* is clearly a direct object of *glaubst*, and the embedded *wh*-interrogative clause *wer Recht hat* is semantically related to *was*, the relation being mediated by *darüber* or *hinsichtlich der Frage*. One might imagine that the corresponding components of (1) stand in a similar relation. (This is, in essence, the traditional idea expressed below in (15).)

In (2d), *wer* is extracted from the embedded object clause. One might imagine that *was* in (1) functions as something like a place holder for *wer* with the effect that the semantic properties and (part of) the structural properties of (1) are calculated just like they are in (2d). (This was, in essence, Tappe's idea expressed below in (16).)

The construction seen in (1) is further illustrated in (3a)–(3f):

	- b. Was what nimmt assumes man one an, wie how der the Prozeß trial ausgeht? ends
	- c. Was what wird becomes angenommen, assumed wie how der the Prozeß trial ausgeht? ends
	- d. Was what hat has sie she gesagt, said mit with wem whom er he kommen come will? wants
	- e. \* Was what scheint seems es, it wen whom Hans Hans geschlagen hit hat? has (McDaniel 1986: 248 (60a))
	- f. ? Was what scheint seems dir, to.you wen whom Hans Hans geschlagen hit hat? has
	- g. Wen whom scheint seems es, it daß that Hans Hans geschlagen hit hat? has

(3c) is a passive construction corresponding to (3b). Hence, if *was* in (3b) is accusative, *was* in (3c) is nominative. In passing, we note that the *was*-construction with *scheint* in (3e) (where *es* is obligatory) is unacceptable, whereas the *was*construction with *scheint* plus dative in (3f) is much better and the extraction in (3g) is fine (for speakers who do long extractions).

In (4), the *was … w*-P construction is embedded in a matrix that selects interrogative clauses:

	- a. … was what du you glaubst, think wer who Recht right hat has
	- b. … was what Karl Karl meint, thinks wen whom wir we gewählt elected haben have
	- c. … was what man one annimmt, assumes wie how der the Prozeß trial ausgeht ends
	- d. … was what angenommen assumed wird, becomes wie how der the Prozeß trial ausgeht ends

Clearly, there is no way to assimilate embedded cases like these to the structure of the paraphrases (2a) or (2b).

The construction can also be iterated:

	- b. Es it ist is egal, no.difference was what du you glaubst, think was what Karl Karl meint, thinks wen whom wir we gewählt elected haben have
	- c. % Was what glaubst think du, you daß that Karl Karl meint, thinks wen whom wir we gewählt elected haben? have
	- d. % Es it ist is egal, no.difference was what du you glaubst, think daß that Karl Karl meint, thinks wen whom wir we gewählt elected haben have
	- e. Wen whom glaubst think du, you daß that Karl Karl meint, thinks daß that wir we gewählt elected haben? have

In (5a) and (5b) *was* occurs twice: this is a natural kind of expression for many speakers, in particular for those who do not do long extractions such as (5e). Many speakers who use both long extractions and the *was*-construction reject 'mixed' examples like (5c) and (5d). But there is a minority who find nothing objectionable with them.

Constructions similar to the *was … w*-P construction occur in a number of languages. Thus, the situation in Frisian seems almost identical to German:

12 The *w*-… *w*-construction


Note, though, that the *wh*-phrase in the embedded clause (*wêr't* and *wa't*) is suffixed by *'t* ('that'), in accordance with the general rule for embedded *wh*-interrogatives in Frisian.

A large group of speakers of Hungarian use a similar construction, sometimes referred to as the '*mit*-strategy':

(7) Mit what gondolsz you.think hogy that mit what mondott said Vili Vili hogy that ki who látta saw Jánost? Janos (Mey & Marácz 1986: 263 (30))

Of this example, Kiss said that "according to the native speakers' intuitions, [this] is not a complex sentence but a series of non-embedded questions" (Kiss 1988 [1991]: 212). That is, she suggested for (7) a structure that might be adequate for (2b). But this is incompatible with the complementizer *hogy* ('that') appearing in (7). It shows up before the *wh*-expressions *mit* and *ki* in accordance with the general rule for embedded *wh*-interrogatives in Hungarian. Kiss in fact considers (7) to be marginal, but this judgement is not universally shared; cf. Marácz (1987). 3

In two major variants of Romani (a Balkan language with Indic substrate), again, a very similar construction exists:

(8) a. So what o the Demìri Demir mislinol thinks kas whom i the Arìfa Arifa dikhol? sees (McDaniel 1986: 111 (31a)) b. Na not ȷanav ́ I.know so what o the Demìri Demir mislinol thinks kas whom i the Arìfa Arifa dikhlâ? saw (McDaniel 1986: 112 (32b))

### **3 Characteristics of variant I**

From embedded constructions as in (4), (5) and (8b), the position of the finite verb in (1), (3) and (6), *'t* in (6) and *hogy* in (7) we can draw some conclusions:

(9) i. The construction is a complex sentence with a constituent clause embedded in a matrix clause.

<sup>3</sup> See also Marácz (1989: Ch. 7) and Horvath (1995) for ample discussion.

	- b. with *was* occupying the position that is characteristic of *wh*-interrogative clauses.

In all cases considered so far, the embedded clause looks like any ordinary embedded *wh*-interrogative clause conforming to the rules of the individual language. This impression is confirmed in (10):

	- b. \* Was what glaubt thinks sie, she daß that man one sich self auf on wessen whose Hilfe help verlassen rely kann? can
	- c. \* Was what glaubt thinks sie, she auf on wessen whose Hilfe help kann can man one sich self verlassen? rely
	- d. \* Was what glaubt thinks sie, she auf on wessen whose Hilfe help sich self verlassen rely zu to können? can
	- e. \* Was what glaubt thinks sie, she ob whether man one sich self auf on dessen his Hilfe help verlassen rely kann? can

(There must be no fall of intonation at the comma.) Although the matrix predicate *glaub-* can combine with *daß* clauses, F2 clauses, and infinitival clauses, (10b)– (10d) are impossible: (10b) has no *wh*-phrase in clause initial position; embedded F2 interrogatives as in (10c) are disallowed in German; and so are infinitival interrogatives as in (10d). (10e) demonstrates that it is not sufficient for the embedded clause to be interrogative: it must be a *wh*-interrogative clause. This is summarized in the third clause of (9):

(9) iii. The constituent clause is formally an indirect *wh*-interrogative clause.

All matrix predicates lexically select a non-interrogative complement clause (in fact, all can combine with a *daß* clause), and many do not even allow for an interrogative complement, (11). Predicates that only select interrogative complements cannot combine with *was*, (12).

	- b. \* Karl Karl denkt, thinks welchen which Kandidaten candidate wir we gewählt elected haben have
	- c. Was what denkt thinks Karl, Karl welchen which Kandidaten candidate wir we gewählt elected haben? have

12 The *w*-… *w*-construction

	- b. \* Karl Karl möchte wants wissen, know daß that wir we sie her gewählt elected haben have
	- c. \* Was what möchte wants Karl Karl wissen, know wen whom wir we gewählt elected haben? have

This is expressed in the fourth clause of (9):

(9) iv. The matrix predicate selects a non-interrogative complement clause.

It is in large part the tension between (9iii) and (9iv) that gives the *was … w*-P construction its strange appearance.

There is, however, a further aspect to selection by the matrix. In all cases that I am aware of, the matrix can also combine with a nominal expression (*das*, *was*, … ) with propositional meaning in place of the constituent clause, as in (13), and it can often have *es* or *das* in combination with the constituent clause, as in (14).<sup>4</sup>

	- b. Was what denkt thinks Hanna? Hanna
	- b. Hanna Hanna hat has es it oft often gesagt, said daß that es it dort there regnet rains

(i) Was what möchte wants Karl Karl wissen? know


They correlate with the observations on (3e) and (3f):


<sup>4</sup>The constructions seen in (13) and (14) are not confined to matrix predicates that select a *daß* clause:

This observation is expressed in the last clause of (9):

	- a. in place of a complement clause,
	- b. or in addition to a constituent clause.

(This applies to German. I have not inquired into other languages.) It is the coexistence of (9iv) and (9v) that gives rise to the competition between the analytic ideas that we will now turn to.

### **4 Analytic ideas**

In my experience, everyone who is aware of the properties expressed in (9) but has not investigated the construction in detail is prone to suggest an analysis along the lines of (15). (Thus, I am confident (15) can be considered *the* traditional idea although I am not sure that it can be found anywhere in the traditional literature on German.)

	- i. *Was* is a complement of the matrix predicate.
	- ii. The constituent clause is (not a complement but) something like an apposition elucidating *was*; cf. paraphrase type (2c).

Therefore, Tappe's suggestion (Tappe 1980) was felt to be genuinely intriguing:

	- i. *Was* is (not a complement but) a 'scope marker' that is 'base-generated' in Comp; it must be coindexed with a *wh*-phrase in the Comp of the constituent clause.<sup>5</sup>
	- ii. The constituent clause is a complement of the matrix predicate; cf. paraphrase type (2d).

Evidently, both ideas raise quite a number of questions. For instance, while (15i) (unlike (16i)) relies on (9v), the notions of 'apposition' and 'elucidation' in (15ii) are in need of clarification.

The construction exemplified in (14) might seem to be an instance of the relation appealed to in (15ii). But this impression is misleading. Occasionally, *es*

<sup>5</sup>This assumption is of course only applicable to languages that characterize their *wh*-interrogative clauses by some specific 'Comp position'. Thus, it is not evident that it is relevant for Hungarian; cf. (7).

### 12 The *w*-… *w*-construction

and *das* in (14) are considered to be associated with no semantic content whatsoever, so that they do not play any role in the determination of the clause's meaning. If this is true, *was* in (13) and in the *was … w*-P construction must be something totally different, as it obviously contributes to the meaning of the clause. Alternatively, *es* and *das* in (14) are often considered to be cataphors. That is, they contribute importantly to the determination of the clause's meaning, but identify their content with that of the embedded clause they are cataphorically related to. Again, the same cannot be true for *was* in (1), (3), etc.: (1) does not have the (impossible) meaning '(do) you think who is right' that would result from identifying the content of *was* with that of the constituent clause. Thus, if (9v) is relevant at all, its clause (9va) is, but (9vb) cannot play any role for (15) (or (16)). Put differently, it does not seem possible to understand both *was* and the constituent clause in terms of antecedent analytic experience.

Still, some general account might conceivably be developed that predicts that when a matrix predicate takes *was* as a nominal complement, any clause it combines with must be of a different semantic type than the matrix ordinarily combines with, in accordance with (9iii) and (9iv). In this way, (10a)–(10d) could conceivably be accounted for.<sup>6</sup> But then it seems next to impossible to account for the negative datum (10e).

Also, it is not clear why (5c) and (5d) should not be acceptable to all speakers who accept long extractions, given that (17) would be a possible structure for (5c):

### (17) Was*<sup>i</sup>* [glaubst du [daß Karl t*<sup>i</sup>* meint [wen wir gewählt haben]]]?

In (16i), the very concept of a 'scope marker' is in need of clarification. The scope being indicated is obviously the 'scope' of interrogativity. But it may be more, perhaps including the scope of a *wh*-quantifier and, if so, also the scope of the variable restriction (thus differing from pure markers of interrogativity such as *ka* in Japanese). Also, the coindexation is obviously meant to have similar consequences like coindexation of a long extracted phrase and its trace(s), so that the complement is not evaluated as an interrogative clause, in accordance with (9iv). But how does this come about? And how are (10c) and (10d) accounted for? (Cf. Section 10 on the latter question.)

To appreciate how any reliance on the notion of 'coindexation' can be problematic, we may look at a proposal in Hiemstra (1986: 106). The claim there is that (i) *was* and the embedded clause are coindexed (because they both relate to an object position licensed by the matrix), and (ii) any clause and its head are coindexed. Hiemstra (1986) takes *was* and the *wh*-phrase to be situated in the

<sup>6</sup> See Dayal (1994) for an explicit analysis of Hindi along these lines.

heads of their clauses and (iii) to be coindexed with the heads. Alternatively, one may take them to be specifiers of C and (iii') to be coindexed with C. In any case, by transitivity of coindexation *was* and the *wh*-phrase end up being coindexed. This seems like a remarkable result: the coindexation appealed to in (16i) is deduced from more general principles, and (15) and (16) are seen to inadequately isolate different aspects of one and the same structural configuration. In fact, however, transitivity of coindexation in Hiemstra (1986) is just a mirage arising from equivocations. There may be a sensible explication for the coindexation in step (i), although this is far from evident in light of our discussion of (9vb). There may also be some explication for the coindexation of a clause and its head in step (ii), although this again is not at all obvious. Spec-head coindexation in step (iii') – or even coindexation in step (iii) of a *wh*-expression and the position it is situated in – might be explicable in its own way. But these three (hypothetical) explications have nothing in common. For example, the embedded *wh*-phrase is definitely not an object of the matrix in the way that *was* or the embedded clause possibly is one; and the coindexation of embedded and matrix clause that results from transitivity makes no sense at all. Hence, this tale about coindexation fails to have the consequence intended by (16i): it does not express any sensible relation between *was* and the *wh*-phrase. It merely serves to obscure distinctions that no analysis can afford to ignore. (Of course, Hiemstra (1986) is not alone in this: abuse of coindexation is ubiquitous in the literature.)

The version of (16i) in Riemsdijk (1982) more articulately asserts that *was* and the *wh*-phrase bear identical 'scope indices', where a scope index "is a property of the *wh*-feature" that is associated with a *wh*-word and percolates to the *wh*phrase containing that word. Still, the scope index is of the same kind as other indices used in the grammar. Therefore, maleficent interactions with several modules of the grammar must be circumvented by judiciously assigning different percolation mechanisms and well-formedness conditions on coindexation to different levels of representation.

Faced with open questions of all kinds, we turn to observations that might help motivate a choice between (15) and (16).

### **5 Variant II:** *w***-P …** *w***-P**

Many (but not all)<sup>7</sup> speakers of German use a construction that looks just like the *was … w*-P construction, except that it exhibits a copy of the *wh*-phrase in place of *was*:

<sup>7</sup>The variation among speakers has no obvious dialectal or regional basis.

12 The *w*-… *w*-construction

	- b. Wen whom meint thinks Karl, Karl wen whom wir we gewählt elected haben? have
	- c. Wie how nimmt assumes man one an, wie how der the Prozeß trial ausgeht? ends
	- d. Wovon where.of denkst think du, you wovon where.of wir we leben? live
	- e. \* Auf on wen whom hat has sie she gesagt, said auf on wen whom er he warten wait soll? should
	- f. ? Wieviel how-much meint thinks sie, she wieviel how.much das that kostet? costs
	- g. ? Wen whom scheint seems es, it wen whom Hans Hans geschlagen hit hat? has (McDaniel 1986: 247 (59a))

It can also be embedded:

	- a. … wer who du you glaubst, think wer who Recht right hat has
	- b. … wen whom Karl Karl meint, thinks wen whom wir we gewählt elected haben have
	- c. … wie how man one annimmt, assumes wie how der the Prozeß trial ausgeht ends
	- d. … wovon where.of du you denkst, think wovon where.of wir we leben live
	- e. ? … auf on wen whom sie she gesagt said hat, has auf on wen whom er he warten wait soll should
	- f. … wieviel how.much sie she meint, thinks wieviel how.much das that kostet costs

To my ear, (19e) and (19f) seem markedly better than (18e) and (18f). Still, there are strong restrictions on the *wh*-phrase to be copied:

	- a. \* … welche which (Bücher) books du you glaubst, think welche which Bücher books sie she gerne gladly liest reads
	- b. \* … wessen whose (Hund) dog du you meinst, think wessen whose Hund dog das that ist is
	- c. \* … wen whom sie she gesagt said hat, has auf on wen whom er he warten wait soll should

(20a) and (20b) show that the *wh*-word does not combine with an ordinary noun.<sup>8</sup> (20c) shows that when the embedded *wh*-phrase is a prepositional phrase, the full PP must be copied, as in (19e); just copying its nominal constituent is strictly impossible.

Variant I can be embedded in an exclamative matrix (21), and variant II can, too, at least to some extent (22).

	- b. Schildern describe Sie you.honor mal, prtcl was what Karl Karl glaubt, thinks wie how das that funktionieren function soll! should

The copying construction is also known from other languages. It is found in Frisian:

(23) a. Wêr where tinke think jo you wêr't where that Jan Jan wennet? resides (Hiemstra 1986: 99 (3b)) b. Wa who tinke think jo you wa't who that my me sjoen seen hat? has (Hiemstra 1986: 99 (2b))

And in Afrikaans:

<sup>8</sup> Ellen Brandner told me Josef Bayer told her there are actually speakers who use this kind of example.

12 The *w*-… *w*-construction

	- b. Met with wie who het have jy you nou now weer again gesê said met with wie who het has Sarie Sarie gedog thought met with wie who gaan goes Jan Jan trou? marry (Plessis 1977: 725 (11))
	- c. Waaroor where.about dink think jy you waaroor where.about dink think die the bure neighbours wat what / waar where stry argue ons we die the meeste most oor? about (Plessis 1977: 725 (15))

Note that in Afrikaans, embedded *wh*-interrogatives need not have the independent verb in final position: in informal speech, the second position, as seen in (24), is preferred (Ponelis 1979: 530). Notice also the remarkable case of full PP copying combined with preposition stranding in the lowest clause in (24c).

One variant of Romani also makes use of the copying construction:

	- b. Kas whom izglèda it.seems kas whom o the Demìri Demir marȷa?́ hit (McDaniel 1986: 247 (59b))

As a rough summary, variant II can be characterized as in (26):

(26) The characteristics of variant II are identical to (9), except for (9iib): there is a copy of the *wh*-phrase, rather than *was*. The copy (and hence, the *wh*phrase) must not contain a full noun.<sup>9</sup>

Modifying the aspect of the analysis that is responsible for the form of the initial *wh*-expression takes us from an analysis of variant II to an analysis of variant I (or vice versa). It appears, thus, that analyses of variants I and II must be closely related.

Obviously, (15) and (16) differ markedly with respect to their ability to accommodate (26). According to (15ii), there is a relation between the initial *wh*-expression and the embedded clause, but no relation between the initial *wh*-expression and the embedded *wh*-phrase. According to (16), the converse is true. But variant II is characterized by a specific relation between the initial *wh*-expression and the

<sup>9</sup>Considering the observation in McDaniel (1986: 247f.) that (18g) appears to be better than (3e), variant II possibly does not fully comply with (9v).

embedded *wh*-phrase. Hence, the existence of variant II is altogether unexpected upon (15), but seems natural upon (16i).

If the copy in variant II is indeed a 'scope marker' just like *was* in variant I, (20c) shows that Tappe's original version of (16i) is more correct than Riemsdijk's. According to Riemsdijk (1982), the 'scope index' of the PP is identical to the scope index of the nominal embedded in it. Hence, there is no reason why (20c) should be any worse than (19e). But according to Tappe, the initial *wh*-expression is related to the *wh*-phrase itself, as in (19e), rather than to anything embedded in it.

### **6** *Wh***-phrases in situ**

In situ *wh*-phrases provide another opportunity to study the consequences of (15) and (16):


Most speakers I have consulted agree that (27a) is fully acceptable or at least possible. This is expected upon (15i). It is compatible with (16i) if *was* does not just indicate the 'scope' of interrogativity but (at least) the scope of a *wh*-quantifier. Most speakers strongly reject (27b). This is totally surprising upon (15i). Upon (16i), (27b) should be absolutely impossible for all speakers. For some, though, the effect is slightly less strong. The same results are found with embedding:

	- b. ?\* Es it ist is egal, no.difference wer who was what meint, thinks wen whom wir we gewählt elected haben have

Observations on echo questions are similar:

(29) ?\* Karl Karl meint thinks was/, what wen whom wir we gewählt elected haben? have

12 The *w*-… *w*-construction

Most speakers strongly reject examples like this, which is surprising upon (15i). And again, some reject (29) less vehemently than (16i) would lead one to expect. Judgements are sharp with variant II:

	- who thinks where where that place.takes
	- b. \* Es it ist is egal, no.difference wer who wo where meint, thinks wo where das that stattfindet place.takes

For speakers who actively use variant II, (30a) and (31a) are fine, but (30b) and (31b) are inconceivable (on the intended reading).

### **7 LF movement?**

One way to explicate the notion of a *wh*-scope indicator is to assume 'LF movement' of the *wh*-phrase from the embedded clause to the initial *wh*-expression. There are (at least) two problems with this idea: coordination and matrix negation.

Consider (32a) and (32b):

(32) Es ist egal,

> it is no.difference


Although a *whether* clause and a *wh*-clause can in general be conjoined, as in (32a), they cannot in the *w- … w*-construction (32b). This is just what we would expect on the evidence of (10e). And expectedly, two *wh*-clauses can be conjoined, as in (32c). But what would the result of LF movement look like in this case? Both *wann* and *wen* would have to move to the position of *was* – how are they situated

to one another at LF?<sup>10</sup> Even if one might prefer to leave this question to a general theory of coordination, it is of no use to ignore it for long.

As for negation in the matrix, consider first the examples in (33): a *was … w*-P construction in (33a), a long extraction in (33b), a sequence of unembedded clauses (just like (2b)) in (33c), and a complex construction like (2c) in (33d).

	- b. Wen whom meint thinks jeder, everybody daß that Hanna Hanna mitbringt? with.brings
	- c. Was what meint thinks jeder*\*; everybody wen whom bringt brings Hanna Hanna mit? with
	- d. Was what meint thinks jeder everybody hinsichtlich wrt. der the Frage, question wen whom Hanna Hanna mitbringt? with.brings

None of these examples is problematic.<sup>11</sup> But when *everybody* is replaced by *nobody*, results are very different, as Kiss (1988 [1991]: 214) was the first to observe (for Hungarian):

	- b. Wen whom meint thinks keiner, nobody daß that Hanna Hanna mitbringt? with.brings
	- c. \* Was what meint thinks keiner*\*; nobody wen whom bringt brings Hanna Hanna mit? with
	- d. Was what meint thinks keiner nobody hinsichtlich wrt. der the Frage, question wen whom Hanna Hanna mitbringt? with.brings

<sup>10</sup>And in terms of (16i): what would it mean for *was* to be 'coindexed' with both *wann* and *wen*? <sup>11</sup>Also, the bound reading of the pronoun in (i) is fully acceptable to many speakers, pace Dayal (1994: 152 (21b)):

<sup>(</sup>i) Was what glaubt thinks [jeder every Student]*i*, student*<sup>i</sup>* mit with wem whom er*i* he*<sup>i</sup>* gesprochen spoken hat? has

12 The *w*-… *w*-construction

The extraction in (34b) is possible (if somewhat marginal) for speakers who do long extractions. In contrast, (34a) is definitely bad (or impossible, for some speakers). Notice also that (34d), which is supposed to be semantically similar to the analysis of (34a) upon (15ii), is possible (in certain contexts). This appears to indicate that (15) will not provide a plausible account for (34a). But LF movement in accordance with (16i) does not seem to provide a plausible account either, for why should it be blocked in (34a) while S-structure movement is possible in (34b)?

### **8 Interpretational dependencies**

Originally, the notion of 'LF movement' was motivated by the observation that certain interpretational dependencies seem to comply with restrictions that overt (S-structural) movement is subject to. Viewed from this perspective, (34b) is a genuine problem for an LF movement account of (34a). Still, there is a similar blocking effect induced by negation in (35c), pointed out to me by Jürgen Pafel (p.c.) in spring 1989:

	- b. [Was] what hat has Karla Karla [für for Bücher] books gelesen? read
	- c. \* [Was] what hat has niemand nobody [für for Bücher] books gelesen? read

In general, *was* can be detached from an NP of the form *was für NP*, as in (35b). But when negation intervenes between the preposed part *was* and the remnant *für NP*, as in (35c), the result is bad. Similar observations hold for in situ *wh*phrases as in (36):

	- b. Es it ist is egal, no.difference wer who wen whom niemals never betrogen deceived hat has
	- c. \* Es it ist is egal, no.difference wem to.whom niemand nobody wen whom vorgestellt introduced hat has
	- d. \* Es it ist is egal, no.difference wer who niemals never wen whom betrogen deceived hat has

Thus, (34a) seems to fall into a pattern such that at S-structure negation must not intervene beween some interpretationally dependent expression – the *wh*phrase in (34a), the remnant in (35c), the in situ *wh*-phrase in (36) – and the position it is dependent on. For thorough empirical and theoretical discussion see Beck (1993) and Beck (1996), where a non-traditional notion of 'LF (movement)' is motivated.<sup>12</sup> In broader empirical context, then, (16i) actually appears to receive support from (34a).

### **9 Exclamatives**

In (21) and (22), partly repeated in (38) below, we have seen that the *w- … w*construction can be embedded in an exclamative matrix. This merits closer inspection.<sup>13</sup>

For present purposes, I consider a predicate to be 'exclamative' if it (i) combines with clauses that look like *wh*-interrogative clauses but (ii) does not (on the same reading) combine with *whether* clauses and (iii) allows the *wh*-clause to be introduced by certain *wh*-phrases that do not occur in bona fide interrogative clauses.<sup>14</sup> The predicates *wunder-* ('be surprised') and *schilder-* ('describe') are exclamative in this sense. Only *wunder-* is illustrated in (37); but note that exclamative predicates need not in general be 'emotive' in any obvious sense.

	- b. \* Sie she wundert is.surprised sich, self ob whether du you viel much verdienst earn
	- c. Sie she wundert is.surprised sich, self [was what für for riesige huge Füße] feet er he hat has
	- d. Sie she wundert is.surprised sich, self [wie how erfolglos] unsuccessful er he ist is
	- e. Sie she wundert is.surprised sich, self [welches which Behagen] comfort sie she empfindet senses

<sup>12</sup>Contrary to Beck (1996: 48), but in accordance with Beck (1993: 11), I consider it highly probable that at least *für* in (35b,c) must be relevantly related to *was*, since *was für* is something like an idiom.

<sup>13</sup>I am grateful to Franz d'Avis for useful conversation on this topic.

<sup>14</sup>Thus, it is the similarity in German of exclamative and interrogative predicates with respect to their complements that gives rise to our discussion. Note this is not universal: Irish, e.g., does not have it, according to McCloskey (1979: 99).

12 The *w*-… *w*-construction

	- has

*wh*-phrases like those in (37c-g) are impossible (or, at least, infelicitous) in true interrogatives; I will call them 'exclamative *wh*-phrases'. The special properties of exclamative *wh*-phrases cannot in general be traced to lexical properties of some *wh*-word. Thus, *was für* in (37c), *wie* in (37d), and *welch-* in (37e) seem to be just the same as in ordinary *wh*-interrogative phrases. In these cases, the exclamative quality of the phrases apparently derives compositionally from the combination with the other constituents in the *wh*-phrase. (But adverbial (or ad-adverbial) *wie* in (37f) and *was* in (37g), both meaning 'how much', seem to be confined to exclamatives.) Absence of *whether* clauses, as in (37b), is a necessary but not sufficient condition. There are some classes of predicates such as *aufzähl-* ('enumerate') that take bona fide *wh*-interrogative clauses but no *whether* clauses; see Schwarz (1994) for thorough discussion. Thus, the correct generalization appears to be: if a predicate takes a clause with an exclamative *wh*-phrase, it also takes a clause with an ordinary *wh*-phrase, but does not (on the same reading) take a *whether* clause.

Some examples with the *was … w*-P construction appear in (38):

	- b. Schildern describe Sie you.honor mal, prtcl was what Heinz Heinz glaubt, thinks wie how das that funktionieren function soll! should = (21b)
	- c. Sie she findet finds es it schrecklich, awful was what Heinz Heinz sagt, says wer who alles all gekommen come ist is
	- d. Er he begreift grasps jetzt, now was what sie she denkt, thinks was what für for Nägel nails wir we brauchen need

But examples degrade significantly when the *wh*-phrase is an exclamative *wh*phrase:

	- b. Schildern describe Sie you.honor mal, prtcl (⁇was ( what Heinz Heinz sagt) says) welches which Behagen comfort er he empfindet! senses
	- c. Sie she findet finds es it schrecklich, awful (?\*was ( what er he glaubt) thinks) was what sie she manchmal sometimes schnarcht snores
	- d. Er he begreift grasps jetzt, now (?\*was ( what sie she denkt) thinks) was what für for winzige tiny Nägel nails wir we brauchen need

On a first look, the material in parentheses may be felt to be anything between mildly disturbing and thoroughly confusing. The longer the examples are looked at, the more judgements appear to converge towards outright rejection. As can be expected upon this observation, unembedded counterparts are nothing better, be they interrogative (40) or exclamative (41):<sup>15</sup>

	- b. ⁇ Was what sagt says Heinz, Heinz welches which Behagen comfort er he empfindet? senses
	- c. ?\* Was what glaubt thinks er, he was what sie she manchmal sometimes schnarcht? snores
	- d. ?\* Was what denkt thinks sie, she was what für for winzige tiny Nägel nails wir we brauchen? need

<sup>15</sup>There is one exception:

<sup>(</sup>i) was what denkst think du you.sg / meinen think Sie you.honor / glaubt think ihr, you.pl was what der he manchmal sometimes schnarcht! snores

This unembedded exclamative *was … w*-P construction is extremely restricted along several dimensions. Only verba sentiendi are possible matrix predicates (no verba dicendi); only functionally second persons appear as their subjects; the verb must appear in second position, even though usually the final position as in (41) is possible or even preferred; and the meaning is not compositional: the matrix translates as 'you cannot imagine …'.

12 The *w*-… *w*-construction

	- b. (⁇Was ( what Heinz Heinz sagt) says) welches which Behagen comfort er he empfindet! senses
	- c. (?\*Was ( what er he glaubt) thinks) was what sie she manchmal sometimes schnarcht! snores
	- d. (?\*Was ( what sie she denkt) thinks) was what für for winzige tiny Nägel nails wir we brauchen! need

As surprising as these observations are, they seem to demonstrate that (16i), as opposed to (15ii), is correct in that they seem to reveal a specific dependency between *was* and the *wh*-phrase in the embedded clause.

However, this impression might be deceptive. I assume all *wh*-clauses receive a Hamblin style interpretation. The *wh*-phrase denotes a set of contextually salient entities (of suitable semantic type), call this the W-Set. Correspondingly, the *wh*clause denotes a set of propositions, call this the C-Set. The cardinality of the C-Set depends on the cardinality of the W-Set. Interrogative and exclamative predicates exert different conditions on the C-Set. The essence of interrogativity is that there is a possible choice between different members of (the W-Set, hence) the C-Set. It appears that ordinary *wh*-phrases invariably are associated with a non-trivial W-Set, that is, a set with more than one member. (Hence, the C-Set of any *wh*-clause they occur in has more than one member.) But exclamative predicates are not concerned with the possibility of choice. Rather, they induce a (speaker's) presupposition that some member(s) of the C-Set be true. Exclamative *wh*-phrases, in turn, appear to always denote a singleton set; and I suggest that is why they do not occur with an interrogative matrix. This may be illustrated with a predicate such as *tell* that can be exclamative, interrogative or declarative:

	- b. She did not tell me whether this fool or that fool or … had called her.
	- c. There is/are some x, x a fool, such that she did not tell me that x had called her.
	- d. She did not tell me what a fool had called her.
	- e. She did not tell me that such a fool had called her.
	- f. There is a certain extraordinary amount *a* such that she did not tell me that some person who is a fool to degree *a* had called her.

Here, (42a) is ambiguous between an interrogative reading, which can be paraphrased by (42b), and an exclamative reading, which can be paraphrased by (42c). But (42d) with the exclamative *wh*-phrase *what a fool* can only be paraphrased

by (42e). The message in (42d) is not that there are several fools such that one (or more) of them has called her, but that some person who called her is a terrible fool. Thus, a slightly more articulate paraphrase may look like (42f).

If considerations along these lines are correct, it may be possible to explain (39)–(41) upon (15ii), i.e., by relying on a relation between *was* and the embedded clause, rather than its *wh*-phrase. In any case, the initial *wh*-expression in a *w- … w*-construction must have properties of an ordinary *wh*-phrase in that it induces a non-trivial W-Set whose cardinality is incompatible with that of (the exclamative *wh*-phrase in) the embedded clause. This is natural upon (15i). Upon (16i), it seems unexpected for a 'scope marker' to have a property like this.

### **10 On (9iii)**

According to (16ii), the embedded clause is a complement of the matrix. (16i) is intended to imply that, semantically, it cannot be an interrogative clause. How, then, can the empirical generalization (9iii) follow from (16)? Specifically, the question is how to account for (10c) and (10d), repeated below.

From Section 8 we know that an in situ *wh*-phrase in a multiple interrogation structure is subject to similar restrictions as the *w- … w*-construction; cf. (36). Now observe in situ *wh*-phrases in embedded F2 clauses:

	- b. \* Es it ist is egal, no.difference wer who der of.the Meinung opinion war, was wer who hätte had dort there gewohnt resided

Even though (43a) is not a model of beauty, relating the embedded postverbal *wer* to the matrix *wer* is possible. The same is strictly impossible with *wer* in (43b). Thus, the preverbal position in an embedded F2 clause, which can be considered a 'Comp position' in the sense of (16i), cannot be related to a *wh*-phrase in the matrix Comp. This fact may be sufficient to account for (44) (= (10c)):

(44) \* Was what glaubt thinks sie, she auf on wessen whose Hilfe help kann can man one sich self verlassen? rely

From (16)'s perspective, the problem with (45) (= (10d)) is very different:

12 The *w*-… *w*-construction

(45) \* Was what glaubt thinks sie, she auf on wessen whose Hilfe help sich self verlassen rely zu to können? can

There are relative clauses such as (46a) that involve an initial infinitival clause, and some speakers accept similar *wh*-interrogative clauses (46b); cf. Trissler (1991).

	- b. (Sie (she wollte wanted wissen) know) [[[welchen which Umstand]*<sup>i</sup>* circumstance [t*<sup>i</sup>* zu to berücksichtigen]] heed man one nicht not vergessen forget sollte] should

Infinitival clauses like these are peculiar in that they are pied-piped relative or*wh*interrogative phrases. That is, the '*wh*-feature' that originates from the relative/ interrogative word contained in their Comp position cannot rest in that Comp but percolates up to the infinitival clause. For some reason, infinitival clauses in German never tolerate a relative/interrogative phrase in their Comp. That is, the phrases *welchen Umstand* in (46b) and *auf wessen Hilfe* in (45) are not *wh*-phrases in the technical sense; only their mother constituents are. Hence, the infinitival clause in (45) does not have a *wh*-phrase in its Comp, thus violating (16i).

### **11 Relative clause constructions**

McDaniel reports on Romani relative clause constructions (47) that are remarkably similar to interrogative *w- … w*-constructions. She even found a speaker of German who accepted the construction in (48) (cf. McDaniel 1986: 189, note 8).<sup>16</sup>


<sup>16</sup>McDaniel documents and discusses some further kinds of 'partial *wh*-movement' in Romani and in variants of German that I have no independent information about; see McDaniel (1986) and McDaniel (1989). According to McDaniel et al. (1995), approximately the same range of constructions can be found in child English.

(48) % Das that ist is der the Junge, boy mit with dem whom ich I glaube, believe mit with dem whom Hans Hans spricht speaks (McDaniel 1986: 182 (125b))

Certain relative clause constructions in Irish evidence the same structural properties:

(49) (an the doras) door aL Cgap mheasann think sibh you [aN Cpron bhfuil is an the eochair key ann] in.it (McCloskey 1979: 19 (49))

The particle *aN* introduces clauses containing a resumptive pronoun; thus, the clause in brackets could be used as a so-called 'indirect' relative clause by itself. The particle *aL* usually introduces clauses containing a gap/trace (in various extraction constructions, e.g. in 'direct' relative clauses). Cf. also McCloskey (1979: 44; 168). But evidently, there is no NP or PP gap: the matrix predicate (*think*) does not combine with a non-propositional complement NP/PP that could serve as a trace related to the antecedent NP in (49). Exactly the same consideration applies to (47) and (48). Hence, the traditional idea (15) is unable to accommodate constructions like these.

### **References**


Plessis, Hans du. 1977. *Wh* movement in Afrikaans. *Linguistic Inquiry* 8. 723–726. Ponelis, Fritz A. 1979. *Afrikaanse sintaksis*. Pretoria: van Schaik.


Trissler, Susanne. 1991. Infinitivische w-Phrasen? In Marga Reis & Inger Rosengren (eds.), *Fragesätze und Fragen. Referate anläßlich der 12. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft* (Linguistische Arbeiten 257), 123–144. Tübingen: Niemeyer.

### **Chapter 13**

## **Observing non-finite verbs: Some 3V phenomena in German-Dutch**

Tilman N. Höhle

### **1 Non-finite forms**

The system of non-finite verb forms of Standard German and Standard Dutch is rather poor. It comprises just three forms: the bare infinitive, the *zu-*infinitive, and the participle. While the *zu-*infinitive is just the bare infinitive with the prefix *zu* (or *te*, etc.) attached to it, the form of the participle is somewhat more subtle.

It has the 'weak' suffix *-t* (or *-d*), with the stem usually unmodified; or it has the 'strong' suffix *-en* (often developed into *-e*), usually with ablaut of the stem vowel. In most parts of Low German and in Frisian, this is all there is. In part of southern Low German (Ostfälisch), the participle in addition bears the prefix *e-*. In High German and most of Dutch, it instead bears the prefix *ge-* according to rather peculiar rules.

The fundamental condition in Standard German (and many High German dialects), as proposed in Curme ([1922]: 257), is whether or not the first syllable of the stem bears the main word accent. A prefix never bears the main accent of the

<sup>§</sup> *Editors' note:* This work was originally published in Brandt, Patrick & Eric Fuß (eds.). 2006. *Form, structure, and grammar. A Festschrift presented to Günther Grewendorf on occasion of his 60th birthday* (Studia grammatica 63), 55–77. Berlin: Akademie-Verlag. The layout and citation style have been adapted to the format chosen for the present volume; in addition, small textual changes have been made by adding the missing Standard German glosses for the examples (20a,b), (37a), and part of the English translation for (30a).

Tilman N. Höhle. 2019. Observing non-finite verbs: Some 3V phenomena in German-Dutch. In Stefan Müller, Marga Reis & Frank Richter (eds.), *Beiträge zur deutschen Grammatik. Gesammelte Schriften von Tilman N. Höhle. Second revised edition*, 461–490. Berlin: Language Science Press. DOI:10.5281/zenodo.2588371

verb.<sup>1</sup> Thus, the participles in (1) have their main accent on the vowel marked in italics, and they never bear the participial *ge-*:

(1) be-sch*ä*digt ('damaged'), er-l*i*tten ('suffered'), ge-h*o*rcht ('obeyed'), übers*e*tzt ('translated')

When the verb has no prefix, its first syllable may escape main accent because of a verbal suffix that attracts stress (*-ier*, *-isier*), as in (2a); or for any other (often unknown) reason, as in (2b):

	- b. berl*i*nert ('talked Berlinian'), mi*a*ut ('mewed'), schmar*o*tzt ('sponged'), stib*i*tzt ('filched')

Absence of main accent on the first syllable is sufficient for the absence of participial *ge-*. It is also almost necessary. In Standard German, just one verb lacks *ge*idiosyncratically, i.e., immediately before the accent (viz., the 'passive auxiliary' *werd-*). In many dialects, more verbs idiosyncratically do without the prefix.

In some dialects, the accent condition is insufficient. E.g., in Sondershausen (3a) and in Hämmern (near Sonneberg, (3b)) the prefix *gə-* (or *jə-*) is present in cases like (2):


In such dialects, *ge-* is absent just before a verbal prefix, as in (1) (and idiosyncratically with certain verbs). This is also the rule in Standard Dutch.

The rules governing the form of participles are formally interesting upon explicit analysis.<sup>2</sup> But to the extent that the system of non-finite forms has attracted attention, it is mostly restricted to the 'substitute infinitive' exemplified in (4), which all members of the German-Dutch linguistic continuum are supposed to have.<sup>3</sup>

<sup>1</sup> Prefixes thus differ sharply from particles such as *aus* in (3a). (Cf. Müller (2002) for a study of particles.)

<sup>2</sup>By a 'formally explicit analysis' I mean a theory expressed in a model-theoretic framework such as (R)SRL; cf. Richter (2000). For steps towards grammatical research on German-Dutch within this framework, cf., e.g., Meurers (2000), Reinhard (2001), Bouma (2003), and references therein.

<sup>3</sup> Except for Yiddish and (major parts of) Low German. Cf. Schmid (2005) for some comparative information.

13 Observing non-finite verbs

	- b. wenn ich ihn doch hätte schnarchen hören! 'if I only had heard him snore!'

The construction is puzzling in that the 'perfect auxiliary' *hab-* ordinarily requires its verb complement to be a participle, not an infinitive, cf. (5), (7); and the position of *hab-* is counter to the ordinary rule of leftward selection in the Standard German verb complex,<sup>4</sup> cf. (6), (7).

	- b. wenn ich ihn doch schnarchen gehört hätte!
	- b. \* wenn ich ihn doch hätte schnarchen gehört
	- b. \* wenn ich ihn doch schnarchen hören hätte

Thus, four questions pose themselves:

	- ii. Why is it, of all forms, the bare infinitive that replaces the participle?
	- iii. Why is the participle only replaced when it (a) is selected by a particular perfect auxiliary and (b) selects another verb in a non-participial form by itself?<sup>5</sup>
	- iv. Why cannot *hab-* occur in the ordinary word order here?

There is an extensive literature that seeks (or presupposes) causal connections between answers to these questions (primarily, questions (8ii) and (8iv)); cf. Schmid (2005) and references therein; also contributions in Seuren & Kempen (2003).


<sup>4</sup> I take a *verb complex* (*vc*) to be either *pure* or *impure*. The head of a *vc* is a verb or a *pure vc*. Assuming strictly binary branching, the non-head in a *pure vc* is a verb or a particle or a *pure vc*. In an *impure vc* it is any other verbal projection, and it follows the head, e.g., in Standard German (i), West Flemish (ii), and (19c), (21c) below. (This can look confusingly similar to clause or conjunct initial preposed (finite or non-finite) verbs; cf. Höhle (1997).)

<sup>5</sup> In some variants of German the third verb can be replaced by some pronominal, as in *das hättest du nicht müssen* ('you wouldn't have had to do that'). I leave that aside. Still, it is clear from cases like this that the causal link from (8iiib) to (8ii) found by Kurrelmeyer (1910: 167ff.) for the early times has got lost.

It is hardly possible, though, to maintain any truly causal connection between (8iv) and the rest in view of the fact that there are speakers who find (7) quite unobjectionable (cf., e.g., Patocka 1997: 279). Although this fact does not make (7) any more palatable to Standard speakers, it would seem to exclude any explanatory account that goes beyond descriptive correlations.

A similar caveat applies to question (8ii). There is a large Middle German area where it is not the infinitive that substitutes for the participle. We will also see that not only participles can be replaced (question (8i)) and that there are remarkable displacement phenomena that surface when three (or more) verbs are related such that V<sup>1</sup> selects V<sup>2</sup> and V<sup>2</sup> selects V<sup>3</sup> (question (8iii)).<sup>6</sup> Thus, the substitute infinitive is just one special case in the family of what I call '3V phenomena'; a case whose very simplicity leads astray many attempts to understand it plainly in terms of what strikes the eye. The observations reported on below should thus be conducive to any more reliable research into the non-finite system.

### **2 Substitutes**

Trebs (1899) reports on the dialect of Oberschwöditz (part of Trebnitz, NW of Zeitz). The participle is formed just as in Standard German. In place of the Standard's substitute infinitive, this dialect has special forms not used elsewhere in the language. These are the data:<sup>7</sup>

	- b. ij ich håwəse habe.sie kund können saːe sehen 'I could see them'
	- c. ij ich håmn habe.ihn wuld wollen drafe treffen 'I wanted to meet him'
	- d. de du håsd hast suld sollen kume kommen 'you were supposed to come'

<sup>6</sup> For general information on this area, Spangenberg (1989) and Rowley (1989) can be consulted. Spangenberg (1993a) has accumulated much detailed information. The *Thüringisches Wörterbuch* (ThürWb) can also be useful.

<sup>7</sup>The relevant data from Trebs (1899: 7, 20ff.) are reproduced here in full. Weise (1906) took up and commented on part of the data; with this exception, they have been ignored in the literature.


These forms are built, it seems, by suffixing *-d* to the bare stem. This suffix looks like the weak participial suffix; but the participle bears the prefix *ge-*. Sometimes

the participle's vowel is different, e.,g., with *dürf-* in (9e) (gedorfd); and several verbs of course have a strong participle, e.g., *seh-* in (9l) (gesaːn), *heiß-* in (9m) (geheːsən), *tu-* in (9n) (gedåːn), and *weis-* in (9o) (gewisən). Exploiting classical terminology, I will call such forms "supine".<sup>8</sup>

In this dialect, then, a supine, rather than an infinitive, substitutes for a participle. But there is more. When the perfect auxiliary has subjunctive form, the supine changes likewise:

	- b. ij ich hedn hätte.ihn kend können drafe treffen 'I could have met him'

Cf. (9a,b). The same would happen with these forms:

(11) *weld* for *wuld* in (9c); *seld* for *suld* in (9d); *mejd* for *muchd* in (9f); *lesd* for *låːsd* in (9k); *diːd* for *duːd* in (9n)

The suffix *-d* is here attached not to the stem but to something similar to forms of the preterite subjunctive. I will call this the "complex supine", in distinction to the "simple" supine in (9).

The situation in Kranichfeld (SW of Weimar) is partially similar to Oberschwöditz. There is a (substitute) simple supine with *brauch-*, <sup>9</sup> *müss-*, *soll-*, as in (12ac):<sup>10</sup>

(12) a. eç ich hɛdsn hätte.es.ihm neç nicht braʊxd brauchen.ss sə zu gaːn geben.g (Schachtschabel 1910: 85)

'I wouldn't have had to give it to him'

b. a er håds hat.es mʊsd müssen.ss måxə machen.in (ib., 84) 'he had to do it'

<sup>8</sup>No term is established in the literature. Weldner (1991) calls the form "participial infinitive".

<sup>9</sup>As a participle, *brauch-* from (12a) follows the V<sup>3</sup> it selects: a *h*˚a*d neç sə komŋ gəbr*a*ʊxd* ('he didn't have to come').

<sup>10</sup>The position in (12c-e) of the particle *hen* (in a verb complex with a branching head) is typical of part of Thuringia. (This is another similarity to Standard Dutch.) See the map in Maurer (1926) for the regional distribution, and cf. Weldner (1991: 210f.) for one local dialect.

From now on, the verb form is often indicated on the Standard German gloss: csfor complex supine; g for gerund; in for infinitive; p for participle; ss for simple supine; st for bare stem.

13 Observing non-finite verbs


Supines *dürf-* (dɔrfd), *könn-* (kund), *mög-* (muxd), *woll-* (wuld) occur under the same conditions. Occasionally, also *lass-* appears as a supine, as in (12d). But unlike Oberschwöditz, Kranichfeld has also the substitute infinitive as seen in (12e). This is usual with *lass-*, and it is the only choice with *fühl-* ('feel'), *helf-* ('help'), *heiß-* ('order'), *hör-* ('hear'), *lern-* ('learn'), *seh-* ('see'), *spür-* ('feel').

In Ruhla (Regel 1868: 116ff.) there are just simple supines of *dürf-* (durft), *könn-* (konnt), *mög-/möcht-* (moijt), *muss-* (mutt), *soll-* (sollt), *woll-* (wollt); otherwise, the substitute infinitive is found. Still, there is something extra: *konnt*, *sollt* and *wollt* freely alternate with *t*-less forms *konn*, *soll*, *woll* (which are different from the infinitives *könn*, *söll*, *wöll*).

Sondershausen has simple and complex supines of the same verbs: *dürf-* (dærft), *könn-* (kunt, kænt), *mög-/möcht-* (moxt, meçt), *muss-* (mʊt, mɪt), *soll-* (solt, sɪlt), *woll-* (wolt). Their distribution is much less clear than in Oberschwöditz. It appears they sometimes alternate freely with each other and with the bare (substitute) infinitive. Thus, one of Döring's (1912) examples is this:


There are at least some supines in Bleicherode near Nordhausen (cf. ThürWb s. v. *sollen*), but I have not found any north of this. Southward, we find supines in Obermaßfeld (near Meiningen), but only with *müss-* (mößt) and *mög-* (möːgt):


All other verbs form the substitute infinitive, such as *woll-* (wöll) in (14b). In nearby Wasungen, only *müss-* has a supine (mösd), as in (15). These are the southernmost supines I have seen.

(15) ich ich huːən habe doːedrü: darüber soː so seːər sehr mösd müssen.ss lach lachen.in (Reichardt 1914: 205) 'I had to laugh about it so much'

Roughly, then, the supine is found throughout the Thuringian area, excepting the most northern and the southern fringe, with large differences in detail from one local dialect to the next.

But it is also found outside this area. Thus, Hanke (1913: 65, 69) reports on the simple supine of *soll-* (sult) and *könn-* (kunt) in a part of Silesia. Graebisch (1907), covering a larger part of Silesia, has found in addition *müss-* (mußt), *mög-/möcht-* (mucht) and *dürf-* (durft), but also *brauch-* (braucht). In eastern Bavarian, supines of *müss-* (miaßt), *möcht-* (mecht), *könn-* (kunnt, kennt), *woll-* (woit), *soll-* (sollt) are found in scattered places (Patocka 1997: 260ff., 264).

Looking westward, I have not found any supine west of the Fulda region, with the exception of two regions near the border to French. Labouvie (1938: 105) reports on substitute forms of *brauch-*, *dürf-*, *könn-*, *mög-/möcht-*, *müss-*, *soll-*, *woll*in Dillingen on the Saar river similar to forms of the preterite subjunctive with the strong participial suffix -*en* attached to them, e.g., (16):


'I would have liked to go on foot'

These forms are in no way sensitive to the mood (subjunctive or indicative) of the perfect auxiliary, even though they are formally a variant of the complex supine.

In part of Alsace, by contrast, there are complex supines that regularly participate in the subjunctive system; cf. Philipp (1987: 135f.). One variant of these systems is found in Strasbourg:<sup>11</sup>

(17) a. van's vɛʀmɛʀ ksɪː vaːʀ, hatʃ ɪm hɔft khɛntə ʃpɪːlə 'if it had been warmer, you could have played in the yard' (Philipp & Bothorel-Witz 1989: 327)

<sup>11</sup>Thanks to Marthe Philipp for giving me (17b,c) in personal communication.

13 Observing non-finite verbs


These forms are similar to finite preterite subjunctive forms. They occur in place of the substitute infinitive when the perfect auxiliary is in subjunctive form. In addition to *könn-*, *woll-* and *müss-* in (17), also *dürf-* (tɛʀftə), *soll-* (sɔtə) and *möcht-* (mɛçtə) are in use.

Returning to the supine mainland, we look into Altenburg.<sup>12</sup> The dialect has simple supines of, at least, *hör-* (hiert), *könn-* (kunnt), *lass-* (lußt), *lern-* (larnt), *mög-/möcht-* (mucht), *müss-* (mußt), *soll-* (sullt), *woll-* (wullt). As usual, they are used in 3V configurations when selected by (indicative or subjunctive) perfect *hab-*. It is thus surprising that with *sollt*, the selecting verb can also be the 'future auxiliary' *werd-*, which ordinarily requires a bare infinitive:

(18) uf 'auf su so en einem Ristwogen Rüstwagen warn werden Se Sie doch doch nich nicht iernd Pfannkuchen Pfannkuchen sullt sollen.ss hule holen.in' (Daube 1895: 56)

'you are surely not supposed to carry any pancakes on such a truck'

With some verbs – at least *müss-* (muß), *helf-* (half), and *hör-* (hier) – an infinitive is replaced by a form that might either be a *t-*less supine (reminiscent of forms in Ruhla) or a bare stem:

(19) a. su so schien's, schien's, all als sal sollte se sie all als alle alte Jungfer Jungfer sich sich dorchs durchs Lam Leben muß müssen.st schlo schlagen.in (Daube 1897: 47) 'so it seemed as though she should have to spend her life as an old

spinster'

<sup>12</sup>My report is based on an inspection of the extant volumes of Daube's 'reader'. Statements in Pasch (1878: 80) and Weise (1900: 154f.) are largely verified by it, but Weise (1906: 195ff.) only partially so.

The infinitive has a Schwa suffix when the stem ends in a consonant; otherwise, it has no suffix. In Daube, *(d)er* (as in (21a) below) is always 'you (pl.)', never 'he', contrary to Weise (1900: 14).

b. wulln wollen se Sie mir mir die die Sochen Sachen widder wieder half helfen.st uf'n auf.den Buckel Rücken hiebe? heben.in (Daube 1895: 61)

'do you wish to help me get the stuff back on my back?'

c. mer man hette hätte kunnt können.ss ene eine Schteckenahle Stecknadel uf auf de die Are Erde hier hören.st folle fallen.in (Daube 1897: 29) 'one could have heard a needle fall on the ground'

The bare stem appears as a substitute for the participle and the infinitive at least with *lass-* (loß):


The regular infinitive does appear on V2, though, whenever it selects V<sup>3</sup> to the left, e.g.:

(21) a. wos was der Ihr nich nicht glei gleich widder wieder ward werdet ausfrasse ausfressen.in (auslöffeln) kunne können.in (Daube 1897: 20) 'which you will not be able to compensate for immediately' b. mer man mußte'n mußte ihn gieh gehen.in loße lassen.in (ib., 16) 'one had to let him go' c. doß daß mer man hette hätte de die Fliegen Fliegen ibber über de die Fansterscheim Fensterscheiben kunnt können.ss loofe laufen.in hiere hören.in (Daube 1905: 21) 'that one could have heard the flies run across the windows'

Judging from Daube, Altenburg is thus like Oberschwöditz in that it shows no substitute infinitive; instead it has a supine and something like a substitute stem.

### 13 Observing non-finite verbs

Some of these forms, however, are not only induced by perfect *have*, but also by 'future' and 'modal' auxiliaries, replacing the infinitive (question (8i)).<sup>13</sup>

In passing, we note that there is a region where a substitute infinitive on *lass*is not only induced by perfect *have* (question (8iiia)). Constellations such as (22) with the 'passive auxiliary' *werd-* are fully acceptable (and the only choice) in Barchfeld (east of Bad Salzungen):<sup>14</sup>

(22) dɪ die syːʁ saure meʊiç Milch wiʁd wird duʁç durch ə ein sagçə Säckchen duʁç durch lɔs lassen.in lœʏf laufen.in (W) 'the sour milk is passed through a sackcloth'

Many similar examples can be found in the *Koch- und Backrezepte* from Steinbach-Hallenberg (SE of Schmalkalden).

The Barchfeld dialect also provides a constellation that is somewhat similar to (18) above:


With *möcht-* (meçd), one could expect the infinitives *diʁf* in (23a) and *mis* in (23b); instead, we find the complex supines *diʁfd* and *med*. But we also see here a strange prefix *gə* on the infinitives *dɑːnts* and *sɛɪ*. This is part of a larger system of non-finite verb forms.

<sup>13</sup>The dialect of Rudolstadt as exemplified in Sommer (1906) is broadly similar (as Weise 1900: VI notes). It differs, e.g., in that there are substitute infinitives with most verbs (next to simple supines and some bare stems).

<sup>14</sup>My information on Barchfeld comes from three sources: the monograph by Heinrich Weldner (1991), which is by far the finest work of its kind; a series of booklets that contain dialect texts and various informations (Weldner [1994] through 2000, available with the Verein Heimatgeschichte Barchfeld); and, most importantly, Weldner has been overwhelmingly generous in sharing his native speaker judgement and his linguistic insight with me in an extended correspondence. I am also grateful for his detailed comments on an earlier version of these pages. Examples from these personal communications are marked "W". (The supines induced by *möcht*in (23) and *brauch-* in (41) below complement the distributional statement in Weldner (1991: 132f.).)

### **3 Further non-finite forms**

In addition to the bare infinitive, Frisian has another non-finite form. It looks like the infinitive with a suffix *-n* attached to it. In honour of a long tradition, this is often called the "gerund". Frisian has no *te-*infinitive; rather, *te* is prefixed to the gerund. The bare gerund is selected by sensory verbs such as *see, hear, feel*, etc. A few verbs, among which *stand*, *sit* and *lie* are prominent, appear as gerunds when selected by *stay* or *go*.

There is but little information on the gerund in Dutch; cf. Marle (1994) and references therein. Low German has two areas with a *zu-*gerund in *-ene*. In a large Swabian area the *zu-*gerund is conspicuous in that it ends in *-et* etc. The more typical gerund in *-e(n)* is found on the border to Italian and in eastern Low German,<sup>15</sup> and also, fortunately, throughout the Thuringian area, with much variation in detail. E.g., Oberschwöditz, Kranichfeld, Bad Frankenhausen, and Sondershausen have just the *zu-*gerund. Thus, *brauch-* ('need') in (12a) above selects the *zu-*gerund sə ga:n ('to give'), where *-n* is the gerundial suffix. In Altenburg the gerund is also selected by *bleib-* ('stay') and *hab-* ('have'). In Hämmern near Sonneberg, many more verbs select the gerund: *helf-* ('help'), *hör-* ('hear'), *seh-* ('see'), *spür-* ('feel'), *mach-* ('make'); *bleib-* ('stay'), *hab-* ('have'), and *lass-* ('let'); *werd-* ('future aux') and *tu-* ('do'); e.g., from Sperschneider (1959):


In (24a), the gerund draːdn ('stand', with suffix *-n*) is selected by blaem ('stay'); in (24b), the gerund ʃdarm ('die', with stem-final *b* and suffix *-n* developed into *m*) is selected by *döid* ('do').

Regel (1868) reports that in Ruhla the gerund can be selected by *hear* and *see*, but only when selection is to the left, as in (25); otherwise the bare infinitive is required, as in (26):

(25) bamme wenn.wir den den hirz Hirsch låufen laufen.g senn sehen (Regel 1868: 102) 'when we see the deer run'

<sup>15</sup>See *Deutscher Sprachatlas*, map 54 (*auszutrinken*) for the German situation at large, and *Sprachatlas der deutschen Schweiz*, vol. IIΙ (pp. 1 and 2) for details in Switzerland.

13 Observing non-finite verbs


In Steinach (north of Sonneberg), the gerund is selected by a (large) subset of the selectors in Hämmern. There is a delightful additional caprice, though. In a small area that used to include Sonneberg, Steinach, and a few small villages north of these (Spechtsbrunn, Siegmundsburg, Altenfeld, Neustadt, Gabel), the gerund can have the special prefix *bə-*. This *be-*gerund occurs if and only if it is the verb complement of *bleib-* ('stay'). The examples that can be found in the literature are reproduced in (27)–(29):


In (23) above, we were intrigued by a prefix *ge-* appearing on the infinitives of *sei-* and *tanz-*. This prefix is similar to the *be-* of the *be*-gerund in that it is bound to non-finite verbs in particular contexts. We had an instance of it even earlier in (14b). There, the form *gewæːr* is built by attaching *ge-* to the bare infinitive of *werd-* ('become'). This is the rule for the *ge-*infinitive throughout.<sup>17</sup> Just like the participial prefix, this *ge-* obeys the rule(s) we discussed with (1)–(3) above. (But unlike the participle, *ge-* infinitives do not idiosyncratically do without *ge-*, it seems.)

The regional distribution of the *ge-*infinitive partially overlaps that of the supine in the Thuringian area. The northern border of the prefix is north of Nordhausen (cf. Haushalter 1884 and Rudolph 1924/1925); the border in the south is somewhere near Bad Mergentheim (cf. Wolf 1998). In the west, Fulda is within the area, but the border is probably not far from it. In the east, the border is not far from Sonneberg, which is inside (cf. Rosenkranz 1938: map 9a). Rudolstadt and Kranichfeld are outside, but a story about Rottenbach near Rudolstadt shows several instances of the prefix (Firmenich 1846: 169). Gamstädt near Erfurt is within the area (Spangenberg 1993b: 33), and so is Bad Frankenhausen. There is, thus, a small northern and a substantial southern region that has *ge-* but no supine. Similarly, there is a large eastern region that has the supine but no *ge-*. But in the rest, both phenomena occur, roughly from Nordhausen to Wasungen and from Fulda to Erfurt.

The basic cooccurrence condition for the *ge-*infinitive is that it is selected by *könn-*, as in (30a) from Stützerbach near Ilmenau and in (30b) from Sondershausen:<sup>18</sup>

(30) a. dos das muß muß mer man ne ihm laß, lassen.in, gearbt arbeiten.in konn kann er er (ThürWb s.v. *lassen*)

'we must grant him this – work, he can'

b. iç ich khån kann mɪç mich nɪç nicht mɪː mehr sʊ so sɪːrə sehr ob ab jəʃtråptsɪːrə strapazieren.in (Döring 1912: 36)

'I can no longer exert myself that much'

<sup>16</sup>The form *(bə)schtenna* is special; see the exposition concerning (57) below.

<sup>17</sup>I am aware of one exception. In a region near Fulda, the bare infinitive of stems ending in *r* takes *-n*. According to Noack (1938: 49) the *-n* is dropped when *ge-* ist prefixed, as in *ɛʌ wil* fɔaʌn *ɛːwəʌ ɛʌ kon ned* gəfɔaʌ ('he wants to drive, but he cannot drive'). – For information on the Fulda region, see also Weber (1959), Wegera (1977), Wild (1991).

<sup>18</sup>Heiligenstadt is unusual in that the *ge-*infinitive (selected by *könn-*) appears to be optional; cf. Firmenich (1846: 199f.). According to Rudolph (1924/1925: 263), only epistemic *könn-* takes the *ge-*infinitive in Rottleberode (near Nordhausen).

13 Observing non-finite verbs

(Recall (3) for the accent condition.) In Sondershausen, *könn-* is the only selector for the *ge-*infinitive. But through most of the *ge-*area, *mög-/möcht-* also selects it, as in (14b). In some places additional verbs can select *ge-*. E.g., Frank (1898: 41) illustrates *dürf-* and *müss-* for Bad Frankenhausen, Haushalter (1884: 14) cites *woll-* and *lass-* as selectors from a publication in the region of Nordhausen. The text in Firmenich (1846: 169) concerning Rottenbach has *woll-* and *soll-*.

### **4 Displacement**

Leaving substitutes aside, we now have, in some places, six non-finite forms: the bare infinitive, the *ge-*infinitive, the bare gerund, the *zu-*gerund, the *be*-gerund, the participle. We illustrate some of this with Sonneberg data from Schleicher (1894: 62f.).

Comparing the forms in (31), we see that *müss-*selects the bare infinitive, *könn*the *ge-*infinitive, and *werd-* the bare gerund:

	- b. mər man kåå kann gəsough sagen.in 'one can say'
	- c. ich ich waarsch werde's soughən sagen.g 'I will say it'

In (32), the gerund (müßən) is selected by *werd-*, and it selects the bare infinitive (reiß, måch). The freedom of word order that there is does not affect these relations.

	- b. mər wir warns werden's måch machen.in müßən müssen.g 'we probably have to do it'

The situation in (33) is structurally identical. The gerund (künna) is selected by *werd-*, and it selects the *ge-*infinitive (gəreiß, gəmåch).

	- b. ich waarsch schä gəmåch künna 'I am probably able to do it'

Finally, the substitute infinitive *höör* in (34) selects the gerund (singa):

(34) ich ich houna habe.ihn höör hören.in singa singen.g 'I heard him sing'

Thus, everything is just as one would expect.<sup>19</sup>

However, this is atypical. Other dialects for which sufficient data are available never accord to these plain expectations, even in close vicinity to Sonneberg. They rather display a rich array of additional 3V phenomena.

In Kleinschmalkalden (north of Schmalkalden, east of Barchfeld and Bad Salzungen), *muss-* again selects the bare infinitive, and *werd-* selects the gerund. But a constellation similar to (32) looks different here:


In a 3V configuration, the gerund selected by *werd-* is regularly replaced by the (complex) supine, hence the form *müd* ('must'). This is just like the substitution we have seen for Altenburg in (18). Remarkable is the fact that *glün* and *dun* are, by their suffix *-n*, unmistakably gerunds, even though *müd* would require them


<sup>19</sup>With one exception: in (i), (ii), *help* would be expected to be a participle/gerund but appears as an infinitive. This is likely related to an anomaly with *help* in Wasungen (Reichardt 1914: 207) that is well-known from Swabian (cf. Heilmann 1999: 61ff.). (Cf. also Schmeller 1821: 380f. for a similar anomaly with *go* in Bavarian.)

13 Observing non-finite verbs

to be infinitives. The gerundial form that *werd-* requires is thus displaced to a verb where it plainly does not belong.

We can say that in the Sonneberg data (32)f. the formal requirement of a verb V<sup>n</sup> is satisfied immediately by its verb complement Vn+1. In (35), in contrast, immediate satisfaction of V<sup>1</sup> 's requirement is excluded when the complement V<sup>2</sup> selects a verb V<sup>3</sup> by itself. Apparently, satisfaction of V<sup>1</sup> 's requirement is mediated to V3, while V<sup>2</sup> appears in a substitute non-finite form.<sup>20</sup>

The differing behaviour of Sonneberg and Kleinschmalkalden with respect to displaced (mediated) selectional requirements is reminiscent of a well-known difference between Dutch and Standard German. Examples such as (36a) with a displaced *zu-*infinitive used to be a topic of traditional German syntax ever since they were observed (and criticized) by Grimm (1837: 949):

	- b. \* ich glaube es zu haben tun können
	- c. ik geloof het te hebben kunnen doen

(Cf., e.g., Curme [1922]: 259.) The majority of Standard speakers feel more or less uneasy with this construction. But the deeper problem is that the construction in (36b), which conforms to our grammatical expectations, is absolutely impossible.<sup>21</sup> This, as Merkes (1895: 66f.) notes, is all the more remarkable as its counterpart in Dutch (36c) is quite unobjectionable (and the only choice).

It is not known what this sharp difference between Dutch and German is induced by. The same question would seem to arise for the Thuringian dialects that have displaced gerundial forms and the Sonneberg dialect that does not.

With respect to constructions such as (36), our dialects are even farther away from Dutch (while their word order properties are conspicuously similar). The displaced *zu* is perfectly natural in, e.g., Rudolstadt, Barchfeld, and Steinbach-Hallenberg:<sup>22</sup>

<sup>20</sup>This formulation insinuates that the displacement of form is more than just an 'edge phenomenon' but involves the selectional system. Cf. Bader (1995) and references therein for the former, and our final section for relevant data. It seems natural that questions (8i, iii) for substitution find a similar answer. These considerations, though, are really beyond the pretensions of this report.

<sup>21</sup>Cf. Meurers (2000) for thorough development of this point.

<sup>22</sup>My information on Steinbach-Hallenberg stems from the data in Anita Steube's (1995) article and from her tutorial correspondence, for which I am deeply grateful. Data from the latter source are marked "S". Some dialect texts can be found in the booklets *Sellemoa* and *Koch- und Backrezepte*.


We expect to find the *zu-*gerund required by *brauch-* on *lass-*, but *lass-* is an infinitive, and in place of the infinitive that *lass-* requires we find the *zu-*gerund on *merk-*, *schnauz-* (tsə ʃnyːtsə), and *sag-* (zu sœːwə).<sup>23</sup> This corresponds exactly to constructions well-known from Bern (Bader 1995; Hodler 1969), Gurin (Comrie & Frauenfelder 1992), and Zürich (Cooper 1995).

Returning to the Kleinschmalkalden data, we see a variation of (35) in (38a):


'he will have it done'

In (38a), *woll-* appears as a supine (wöɫd), and its verb complement is a gerund (hun) rather than the infinitive that *woll-* ordinarily requires. In (38b), the gerund expected on *lass-* is not replaced by a supine but by an infinitive (lås); and the complement again appears as a gerund (maxə), rather than the expected infinitive.

The same kind of displacement can be seen with the *ge-*infinitive:


<sup>23</sup>Altenburg, on the other hand, prefers to drop the *zu-*gerund in this constellation:

<sup>(</sup>i) dar der braucht braucht sich's sich's bluß bloß emol mal vun von dan dem loß lassen.st derstreeche erklären.in (Daube 1895: 38) 'he only needs to let him explain it to him'

13 Observing non-finite verbs

(ib., 168)

b. kåsd kannst mə mir heləf helfen.in gəʃriː schreiben.in '[you] can help me to write'

Here, *lass-* and *helf-* appear as infinitives, even though *könn-* ordinarily requires a *ge-*infinitive. Instead, their complement (*komm-* or *schreib-*) appears with *ge-*.

What happens, then, when a gerund selector (e.g., *werd-*) and a *ge-*infinitive selector (e.g., *könn-*) come together? There was no problem in (33), but now displacing the form would require that one verb be marked for both gerund and *ge-*infinitive. What we actually find is this:


Thus, *könn-* does find its *ge-*infinitive (gəris), but*werd-* does not find any gerund.<sup>24</sup>

It thus seems that V<sup>1</sup> 's requirement is mediated to V<sup>3</sup> if V<sup>2</sup> selects a bare infinitive, as in (35), (37)–(39). This much seems to be necessary and also sufficient for displacement to occur.

The situation in Bad Salzungen is largely identical (Hertel 1888). Looking back to the Barchfeld examples (23), we now recognize the displaced *ge-*infinitive, e.g., in iç meçd aɪ diʁfd *gədɑːnts*: *dürf-* (diʁfd) requires an infinitive; the *ge-*infinitive (gədɑːnts) is required by *möcht-*. However, in the rare case where additional configurations of verbs can be observed, we find that the displacement of forms can actually be more involved. In (41), *könn-* (kend) requires its verb complement *les-* to be a *ge-*infinitive; but *les-* instead appears as the *zu-*gerund required by

<sup>24</sup>This is so in all dialects with displacement that I have seen, with one exception. Speakers of Steinbach-Hallenberg are split. There are some who strongly prefer the form *gespräche* in (i) and (ii) to *gespräch*, the latter being the *ge-*infinitive required by the supine *könnt*, while the former in addition bears the gerundial *-e*. Cf. Steube (1995: 432). Others have the judgements reversed.


'perhaps I will never be able to say that clearly'

I am grateful to Anita Steube and Eberhard Jäger for discussing this issue with me.

*brauch-*. Thus, the *zu-*gerund required by V<sup>1</sup> is mediated to V<sup>3</sup> even when V<sup>2</sup> selects a *ge-*infinitive.

(41) dɔs daß de du dɔs das ned nicht bʀyçsd brauchst kend können.cs tsə zu laːsə lesen.g (W) 'that you need not be able to read that'

As a further dimension of variation, displacing the gerund need not be obligatory. In Wasungen (Reichardt 1914) and in Ruhla, it is optional:


'they probably have to give it to her'

In Steinach, displacement of the gerund does not seem to occur (as in (55) below). This also applies to Coburg (Hermann 1957) and Hämmern (Sperschneider 1959).

For a more systematic picture of one local dialect, we look into Barchfeld. First, the *ge-*infinitive. The *ge-*prefixes appear in accordance with (1)f. (with some verbs doing idiosyncratically without *ge-* in the participle; Weldner (1991: 113)). Therefore, no *ge-* is to be expected in (44):


In (44a), the verb *vettermichel-* has its word accent on the third syllable, hence there is no *ge-*. In (44b), the *ge-*infinitive must be displaced toward the last verb *bedien-*. This verb's word accent is on the second syllable (because of the prefix *be-*)·, hence again no *ge-* here.

In (45), an interesting constellation arises:

13 Observing non-finite verbs

(45) ə er meçd möchte lɪwɚ lieber kend können.cs gəaʁwəd arbeiten.in (W)

'he would prefer to be able to work'

Both *möcht-* (meçd) and *könn-* (kend) select a *ge-*infinitive. In this constellation we expect the *gə-*infinitive required by the first verb to be displaced to the last verb. Thus, the single verb gəaʁwəd apparently satisfies the selectional requirements of two different verbs.

This kind of situation is well known from Swiss German. Thus, in the Bernese example (46), the *zu-*infinitive *z'häuffe* ('to help') is required by both *schiint* ('seems') and *probiere* ('try'):

(46) dr der Hans Hans schiint scheint sine seinen Fründe Freunden probiere versuchen z'häuffe zu.helfen (Bader 1995: 22)

'Hans appears to try to help his friends'

See also Comrie & Frauenfelder (1992: 1058) and Cooper (1995: 187ff., 193). It seems possible that (47) follows the same pattern:


In (47a), *wiss-* (weːsd) requires a *zu-*gerund. The bare gerund that *werd-* requires should be displaced, and the *zu-*gerund *tsə komə* conceivably satisfies both requirements. Similarly in (47b): the *zu-*gerund *tsə dʊn* required by *brauch-* (bʁyçd) conceivably also satisfies *werd-*. Alternatively, (47) might belong to the class of (48) where the gerund from *werd-* must be unrealized in the way discussed with (40) above because of the *ge-*infinitive required by *könn-*,


(The complex supine *kend* is induced by *werd-* in (48a) but by the infinitive *hab*in (48b).)

Displacement of the *ge-*infinitive is usually obligatory, but there is a class of configurations where it is dispreferred or even impossible, viz., with *hear* and *see*. In short examples such as (49) the *ge-*infinitive seems possible, but the bare infinitive is preferred:


With more complex examples such as (50), the *ge-*infinitive is felt to be deviant:<sup>25</sup>


'we could always see Hans work in the garden'

The displacement of the gerund is dispreferred under slightly more inclusive conditions. With *lass-*, displacement seems possible, but not obligatory:


With *hear* and *see*, the bare infinitive is strongly preferred even in simple examples such as (52):


<sup>25</sup>The data in Steinbach-Hallenberg are similar; cf. Steube (1995: 433).

### 13 Observing non-finite verbs

The periphrastic *do* (which is not particularly popular in Barchfeld) ordinarily requires a gerund, as in (53a), but this is left unrealized with *heiß-* ('tell'), as in (53b):


### **5 Word order**

We have noted that details of selection and substitution sometimes correlate with the order of verbs in the verb complex. Thus, in Standard German (and various dialects, including, e.g., Zaans (Hoekstra 1994)), the order V<sup>1</sup> *<* (i.e., before) V<sup>2</sup> correlates with the substitute infinitive on V2. In Kranichfeld and Altenburg, V<sup>2</sup> *<* V<sup>3</sup> correlates with the substitute supine and stem on V2. In Ruhla, V<sup>n</sup> *<* Vn+1 correlates with the infinitive (instead of the gerund) on Vn+1. We now turn to observations on displacement.

In Steinach (near Sonneberg), *werd-* requires the gerund, as in (54). But in (55), with the order V<sup>2</sup> *<* V3, immediate satisfaction is excluded, and displacement is avoided as well. Nearby Hämmern is similar (Sperschneider 1959: 32).


In Barchfeld, the order of verbs is less variable, selection to the right being strictly adhered to. (Cf. Weldner 1991: 199f.) There are two main exceptions: participles and special gerunds.<sup>26</sup>

Participles precede the auxiliary they are selected by (except, optionally, if the latter is in finite form). We thus have the relative order seen in (56):


The gerund (sεɪn) in (56b) and the *ge-*infinitive (gəhɔː) in (56c) immediately satisfy their selector's requirements, even though they select a verb V<sup>3</sup> by themselves. A similar constellation was seen in (54b). This thus requires our sketch of the displacement rule (discussed with (35) above) to be modified: it must be order sensitive such that the immediate satisfaction by V<sup>2</sup> of V<sup>1</sup> 's formal selectional requirement is excluded only if V<sup>2</sup> *<* V3. (This might also apply to (36a); but it does not apply to the substitution case (4).)

The situation with special gerunds is similar. The ordinary gerunds of *steh-* ('stand') and *lieg-* ('lie') are *ʃden* and *lɛɪn*, but there are also special long forms *ʃdenə* and *lɛɪnə*. They must be selected by *bleib-* ('stay') or *hab-*, *lass-*, *seh-* (cf.

<sup>26</sup>As a third exception, *könn-* can follow its *ge-*infinitive, but only when finite (while in (54b) it is a gerund):


### 13 Observing non-finite verbs

Weldner 1991: 113).<sup>27</sup> These verbs must follow the gerund they select, as in (57). (Recall also (25).)


They thus differ sharply from *werd-*, which must precede the gerund it selects:

(58) iç ich glaɪ glaube, dɔs daß ɚ er bɪː wie gəweːnliç gewöhnlich əʀem herum wiʁd wird ʃden stehen.g / gəweːnliç gewöhnlich wiʁd wird əʀem herum ʃden stehen.g (W)

'I believe that he will hang about as usual'

This is why *werd-* is standardly involved in the displacement of gerunds while *bleib-* etc. are not.

There is a rare constellation in (59) and (60) (from Steinach and Wasungen) that is, in a sense, complementary to (56c) and (57b):


b. iç ich håusnʌ habe's.ihn los lassen.in khün können.in gəmåx machen.in (ib., 370)

<sup>&#</sup>x27;I could make him do it'

<sup>27</sup>With the long gerund and two supines (but no *be*-gerund), Barchfeld thus has eight non-finite verb forms.

The few bare gerunds found in Sommer (1906) (Rudolstadt) are all selected by *bleib-*. Otherwise, the verbs that in Barchfeld take the special gerund select a Thuringian adjective in *-nig*, e.g.:

<sup>(</sup>i) da 'there blieb'r he stayed liegnig lying / stihnig standing / sötznig sitting / stecknig stuck / ausnig out' (Sommer 1906: vol. 1: 31, 39, 46, 66, 397)

(60) ich ich wüːərən würde.ihn ned nicht håː haben.in laəs lassen.in kön können.in gəruf rufen.in 'I wouldn't have been able to have [s.o.] call him' (Reichardt 1914: 207)

What is unusual here is the order in the verb complex: V<sup>2</sup> *<* V<sup>1</sup> *<* V3, where V<sup>2</sup> is *lass-* and V<sup>1</sup> is *könn-*. The varying direction of selection does not seem to disturb the usual displacement relations: the last verb (V3) is selected to the right by *lass-*; this is sufficient for the *ge-*infinitive (required by *könn-*) to be mediated to V3, it appears.

### **References**


*Deutscher Sprachatlas*. [1927ff.] Marburg: Elwert. [http://www.diwa.info].

Döring, Edmund. 1912. *Beiträge zu einer Laut- und Wortlehre der Sondershäuser Mundart* (Beilage zum Programme des Fürstlichen Gymnasiums mit Realschule zu Sondershausen, Ostern 1912). Sondershausen.

13 Observing non-finite verbs


Regel, Karl. 1868. *Die Ruhlaer Mundart*. Weimar.


### **Chapter 14**

## **Spuren in HPSG**

Tilman N. Höhle

### **1 Merkmalarchitektur von HPSG**

Die Extraktionstheorie von HPSG ist in den Grundzügen ähnlich wie die von 1 Gazdar et al. (1985). Infolge einiger allgemeiner Unterschiede zwischen GPSG und HPSG haben Spuren jedoch etwas andere Eigenschaften.

Das 'X-bar System' ist reduziert. Es wird nur zwischen X 2 0 (*word*) und X<sup>1</sup> (*phrase*) unterschieden. Eine Konstituente (*sign*) ist genau dann ein X<sup>1</sup> , wenn sie eine Tochter hat (ein dtrs-Attribut trägt).

Jede Konstituente trägt ein Valenzattribut (hier: subcat, kurz sct), in dessen 3 Wert die noch nicht abgebundenen selegierten Konstituenten aufgelistet sind. Dieses Attribut ist in dem Wert eines Attributs local (kurz: l) enthalten. Anstelle von 'ID-Regeln' wie in GPSG gibt es Wohlgeformtheitsbedingungen über die Kombination von dtrs-Werten und sct-Werten an Mutter und Head-Tochter.

Die 'Wortstellung' in einem Satz *Kim likes candy* ist dadurch beobachtbar, daß 4 ihm eine zeitlich geordnete Lautfolge kɪm#laɪks#kændɪ entspricht. In GPSG wird diese Ordnung auf sehr indirekte Weise erreicht.

<sup>§</sup>*Anmerkung der Herausgeber:* Das Papier stellt die bisher unveröffentlichte Textfassung eines Vortrags auf der GGS-Tagung in Tübingen am 14. Mai 1994 dar. Formatierung, Absatz- und Beispielnumerierung sowie der Zitierstil wurden weitgehend an die Konventionen des Bandes angepasst. Den Beschreibungen der Werte von slash in (7) wurden Mengenklammern hinzugefügt, die in der Vorlage nicht stehen.

Tilman N. Höhle. 2019. Spuren in HPSG. In Stefan Müller, Marga Reis & Frank Richter (Hrsg.), *Beiträge zur deutschen Grammatik. Gesammelte Schriften von Tilman N. Höhle. Zweite durchgesehene Auflage*, 491–498. Berlin: Language Science Press. DOI:10.5281/zenodo.2588373



7 Die X<sup>1</sup> -Konstituenten:


8 Wie in GPSG ist eine 'Spur' ein lexikalisches Element, das sich von anderen durch 3 stipulierte Eigenschaften unterscheidet: Es ist phonologisch leer; es trägt ein slash-Attribut; und der Wert von slash ist identisch mit grammatisch relevanten anderen Eigenschaften der Spur, hier: mit dem Wert von local. Mit Hilfe des Nonlocal Feature Principles (entspricht dem Foot Feature Principle in GPSG) wird der slash-Wert außerdem mit dem local-Wert des Spurbinders identifiziert.


14 Spuren in HPSG

### **2 Lineare Position von leeren Kategorien**

Komplement-Extraktion ohne Spur: Pollard (1985; 1988); Cooper (1990). Mit Spur: 9 Pollard & Sag (1987), Pollard & Sag (1992a: Kapitel 4–6).

In Pollard & Sag (1992a: Kapitel 9.5.1) zitieren P&S Beobachtungen von Picke- 10 ring & Barry (1991) und motivieren damit eine Extraktionstheorie ohne Spuren:

In this section, we will offer a revised theory of filler-gap constructions that begins to make sense of the Pickering-Barry results. […] The basic idea is that slash originates not on traces, but rather from the head that licences the 'missing' element.

Technically, the most straightforward way to implement this idea is by lexical rules.

**Klammer auf.** Außer einer Complement Extraction Lexical Rule (§9.5.1 (62); in 11 Pollard & Sag 1992b gegenüber Pollard & Sag 1992a leicht verändert) schlagen P&S eine Adjunct Extraction Lexical Rule (§9.5.2 (80)) vor. Diese Regel ist aus syntaktischen Gründen (vgl. Hukari & Levine 1993) und aus semantischen Gründen nicht haltbar. Die syntaktischen Mängel kann man durch folgende Umformulierung beseitigen:

$$
\begin{aligned}
\text{(5)} \quad & \begin{bmatrix} \text{(5)} \\ \text{SYNSEM} \begin{bmatrix} \text{LOCAL} \box{\boxed{\text{CATEGORY}}} \boxed{\text{HEAD}} \text{ } \text{ver} \color{red}{b} \end{bmatrix} \end{bmatrix} \begin{bmatrix} \\ \text{0} \end{bmatrix} \\
\begin{bmatrix} \text{NONLOCAL} \boxed{\text{INARER}} \text{SLASH} \ \text{est} \end{bmatrix} \end{aligned}
$$

$$
\begin{aligned}
& \begin{bmatrix} \text{LOCAL} \boxed{\text{LOCAL}} \boxed{\text{INARER}} \begin{bmatrix} \text{SLASH} \boxed{\text{SLASH}} \end{bmatrix} \begin{Bmatrix} \text{Y}^{\prime\prime} \begin{bmatrix} \text{MOD} \boxed{\text{LOCAL}} \end{bmatrix} \end{bmatrix} \end{bmatrix}
\end{aligned}
$$

Es bleiben jedoch semantische Probleme bestehen. Bei Verwendung einer Ad- 12 junkt-Spur treten die nicht auf. **Klammer zu.**

Pickering (1993), Pickering & Barry (1991): 13


	- (6) who Kim likes t
	- (7) a. *who*: N 1 phon *⟨* hu *⟩* l 1 […|sct *elist*] dtrs … b. t: N 1 acc phon *elist* local 1 dtrs … slash *{* 1 *}* c. *likes* t: V 1 phon *⟨* laɪks *⟩* l|…|sct *⟨* Nnom *⟩* dtrs … slash *{* 1 *}* d. *Kim likes* t: V<sup>1</sup> phon *⟨* kɪm, laɪks *⟩* l|…|sct *elist* dtrs … slash *{* 1 *}* e. *who Kim likes* t: V<sup>1</sup> phon *⟨* hu, kɪm, laɪks *⟩* l|…|sct *elist* dtrs …

14 Spuren in HPSG

The essential content of the COP is simply that the phonology of a phrasal sign is functionally dependent upon the daughters. […]

In general […] we assume that [the phon value of the mother is] a permutation […] of the phon values of the sign's daughters. (Pollard & Sag 1987: 169)

Da die Spur (7b) die leere Liste als phon-Wert hat, ist jede Permutation der phon- 18 Werte der Töchter von (7c) gleich dem phon-Wert von *likes*. Generell ist der phon-Wert einer leeren Kategorie im phon-Wert der Mutter niemals auffindbar.

Offensichtlich kann und muß die Ordnung im phon-Wert der maximalen Kon- 19 stituente (7e) als zeitliche Ordnung verstanden werden. Man kann die Theorie so präzisieren, daß dies zugleich die einzige zeitlich interpretierte Ordnungsbeziehung ist. Eine zeitlich interpretierte Ordnung zwischen Schwesterkonstituenten ist nicht ausdrücklich vorgesehen und überflüssig. (Eine zeitliche (transitive assoziative) Ordnung auf der Menge der Wörter in einem Ausdruck ist bei Pollard et al. 1994 explizit ausgeschlossen.) Man braucht deshalb nicht auf Spuren zu verzichten, um " to make sense of the Pickering-Barry results" (Absatz 10).

### **3** *wanna***-Kontraktion**

	- b. who*<sup>i</sup>* you wanna leave t*<sup>i</sup>*
	- b. % who*<sup>i</sup>* you wanna (t*<sup>i</sup>* ) leave the room

Es ist zweifelhaft oder unwahrscheinlich, daß die '*wanna*-Kontraktion' ein pro- 20 duktiver morphophonologischer Prozeß des heutigen Englischen ist. Daher ist es möglich oder notwendig, für *want* in (8a) und *wanna* in (8b) verschiedene Lexikoneinträge zu formulieren. In (10) ist die jeweils benötigte Valenzinformation gegeben.

(10) a. *want*: Nnom<sup>1</sup> , V<sup>1</sup> [*inft*, sct *⟨* N<sup>1</sup> *⟩*] b. *wanna*: Nnom<sup>1</sup> , V<sup>1</sup> [*base*, sct *⟨* N<sup>1</sup> *⟩*]

Für das *want* in (9a) ist ein anderer Lexikoneintrag nötig: (11a). Für die Varianten 21 des Englischen, in denen (9b) akzeptabel ist, ist dann ein Lexikoneintrag wie in (11b) nötig.

(11) a. *want*: Nnom, <sup>2</sup> Nacc, V<sup>1</sup> [*inft*, sct *⟨* 2 *⟩*] b. *wanna*: Nnom, <sup>2</sup> Nacc [local <sup>3</sup> , slash { <sup>3</sup> }], V<sup>1</sup> [*base*, sct *⟨* 2 *⟩*]

22 Der Lexikoneintrag (11b) ist dadurch 'markiert', daß durch ihn eine Spur selegiert wird und kein entsprechender Lexikoneintrag mit normaler NP statt der Spur existiert. Es ist plausibel, daß er aufgrund positiver Evidenz 'gelernt', aber nicht ohne solche Evidenz aufgebaut wird.

### **4 Extraktion von V-Projektionen bei 'kohärenter Konstruktion'**

	- (12) es möchte<sup>1</sup> jemand den Hund [füttern dürfen t1]
	- (13) a. [füttern]<sup>2</sup> möchte<sup>1</sup> jemand den Hund [t<sup>2</sup> dürfen t1] b. [füttern dürfen]<sup>2</sup> möchte<sup>1</sup> jemand den Hund [t<sup>2</sup> t1]
	- (14) a. [den Hund füttern]<sup>2</sup> möchte<sup>1</sup> jemand [t<sup>2</sup> dürfen t1]
		- b. [den Hund füttern dürfen]<sup>2</sup> möchte<sup>1</sup> jemand [t<sup>2</sup> t1]
	- (NZ1) Ein Pfad von Attributen slash|*π* darf nicht sich selbst als Wert enthalten.
	- (NZ2) Für jeden (Teil-)Pfad *π*<sup>1</sup> eines Pfads *π*|slash (*π* = *π*1|*π*2) gilt, daß der Wert von *π*<sup>1</sup> nicht identisch ist mit dem Wert von *π*|slash.

14 Spuren in HPSG

& Nakazawa (1993) – gibt es kein Problem, solange diese Eigenschaft im Wert eines *π*<sup>1</sup> lokalisiert und zugleich (NZ2) eingehalten ist.

### **Literatur**


### **Chapter 15**

## **Spurenlose Extraktion**

Tilman N. Höhle

### **1 Lexikalische Elemente: Sorten oder Lexikoneinträge?**

In einem Satz wie 1 " wenn Heinz scharcht und Maria nicht schnarcht" sind 2 Vorkommen von 1 Entität, die 'lexikalisches Element' (lexical item) heißen soll. Die Vorkommen sind verschieden (= nicht-identisch), weil (a) ihre content-Werte verschieden sind (denn die Werte der Schnarcher-Rolle sind verschieden) und (b) die phonologischen Ausdrücke verschieden (nicht-identisch) sind.

Letzteres folgt aus der Annahme, daß der phon-Wert der maximalen Konsti- 2 tuente eine zeitliche Ordnung repräsentieren soll. Die zeitliche Relation 'früherals' ist irreflexiv (*a* früher-als *b ⇒ a ̸*= *b*) und transitiv, also asymmetrisch (*a* früher-als *b ⇒* nicht: *b* früher-als *a*). Da das erste *schnarcht* früher-als *Maria* ist und *Maria* früher-als das zweite *schnarcht* ist, sind das erste und das zweite *schnarcht* nicht-identisch.

Wie ist ein lexikalisches Element in der Grammatik zu repräsentieren? 2 Mög- 3 lichkeiten: als Sorte oder als Disjunkt im Word Principle.

<sup>§</sup>*Anmerkung der Herausgeber:* Diese bislang unveröffentlichte Arbeit entstand als Materialsammlung für ein Seminar *Entwicklungen in der HPSG* im Sommersemester 1994 an der Universität Tübingen. Die hiesige Textfassung folgt dem Typoskript vom 16.9.1994, zählt jedoch die Absätze im Unterschied zur Vorlage strikt fortlaufend aufsteigend und passt Formatierung, Beispielnumerierung und Zitierstil an die Konventionen des Bandes an. Eine kleine Anzahl offenbarer Versehen der Typoskriptvorlage wurde korrigiert.

Tilman N. Höhle. 2019. Spurenlose Extraktion. In Stefan Müller, Marga Reis & Frank Richter (Hrsg.), *Beiträge zur deutschen Grammatik. Gesammelte Schriften von Tilman N. Höhle. Zweite durchgesehene Auflage*, 499–537. Berlin: Language Science Press. DOI:10.5281/zenodo.2588375

### **1.1 Lexikoneinträge**

<sup>4</sup> Pollard & Sag (1987: 147): " let us suppose that L1*, . . .,* L*<sup>p</sup>* is an exhaustive list of the English lexical signs and R1*, . . .,* R*<sup>q</sup>* is an exhaustive list of the English grammar rules. Then our theory of English is (283):

$$\text{English} = \mathbf{P}\_1 \land \dots \land \mathbf{P}\_{n+m} \land \left(\mathbf{L}\_1 \lor \dots \lor \dots \lor \mathbf{L}\_p \lor \mathbf{R}\_1 \lor \dots \lor \mathbf{R}\_q\right) \tag{283}$$

In other words, an object is an English sign token just in case (i) it satisfies all the universal and English-specific principles, and (ii) either it instantiates one of the English lexical signs or it instantiates one of the English grammar rules." (Ebenso S. 44f.)

	- (1) (*phrase ∧* dtrs *headed-struc*) *⇒* (Schema 1 *∨ . . . ∨* Schema 6)
	- (2) (*phrase ∧* dtrs *head-filler-struc*) *⇒* Schema 6
	- (wp) *word ⇒* (LE<sup>1</sup> *∨ . . . ∨* LE*p*)

### 15 Spurenlose Extraktion

Word-Prinzip ist; und das 'Lexikon' ist die Menge der Lexikoneinträge, die im Word-Prinzip aufgeführt sind.

Außer den <sup>11</sup> " actual lexical entries", für die das Word-Prinzip gilt, nehmen P&S auch " generic lexical entries" an, die in einer multiplen Vererbungshierarchie organisiert sind (Pollard & Sag 1994: 36f.). Die entsprechen inhaltlich offenbar den Wortklassendefinitionen von Flickinger & Nerbonne (1992: 299ff.); sie setzen also die Frames und ähnliche Konzepte aus früheren Arbeiten fort (vgl. Absatz 19). Die genaueren Eigenschaften der 'generic lexical entries' sind unklar (Absatz 86). Jedenfalls können sie nicht zu den LE*<sup>i</sup>* im Word-Prinzip gehören.

**Anmerkung** Bei Pollard & Sag (1994) gibt es keine formal explizite Formu- 12 lierung der Prinzipien. Die informellen Formulierungen vieler Prinzipien legen eine formale Deutung wie in Absatz 6 und 7 nahe, d. h. eine Implikation, die als Antezedens (wie als Konsequens) eine Deskription von (im Prinzip) beliebiger Komplexität hat. Für eine korrekte Semantik solcher Implikationen braucht man die volle (klassische) Negation. Das steht im Widerspruch zu Pollard & Sag (1994: 8): " [Carpenter] sets forth a logic very close to the one that we assume will underlie a fully formalized version of our theory. In very general terms, this can be characterized as a sorted variant of Kasper and Rounds's (1986) logic augmented with path inequalities, definite relations, and set values." P&S wollen also keine volle Negation annehmen. Anstelle der vollen Implikation können sie dann bestenfalls ein 'Constraint System' wie in Carpenter (1992: 228–234) annehmen, bei dem nur Sorten als Antezedens von Implikationsverhältnissen zulässig sind. Aber eine derartige Einschränkung der Deskriptionssprache ist in der Theorie von Pollard & Sag (1994) weder formal noch empirisch begründet. Ich nehme deshalb (mit King) die volle Implikation in Anspruch. Generell gehe ich davon aus, daß die Formalisierung von King (in höherem Maß als die von Carpenter) eine adäquate formale Grundlage für die explizit ausgeführten Teile von Pollard & Sag (1992; 1994) ist. Vgl. King (1992: §§4–5) und Kepser (1994).

### **1.2 Sorten**

Eine Alternative zum Verständnis von lexikalischen Elementen als Lexikonein- 13 trägen scheint in Kapitel 8 von Pollard & Sag (1987) angedeutet zu sein. Dort wird u. a. eine 'Lexical Hierarchy' eingeführt, die aus einer multiplen Vererbungshierarchie zwischen Untertypen des Typs *lexical-sign* besteht.

Auf S. 198 heißt es: <sup>14</sup> " In type subsumption graphs, we use dotted lines to connect 'instances' to the types they belong to. In terms of our formalism, of course,

instances are just minimal types, i.e. types for which no finer distinctions exist. […] In our system of lexical subtypes the instances will just be individual lexical signs."




### 15 Spurenlose Extraktion

Zitat Absatz 14 hervorgeht; s. Roberts & Goldstein 1977a,b. Vgl. auch Pollard & Sag 1987: 193 Anm. 3 und Sag et al. 1992: 313 Anm. 10. Und manche anderen Typen entsprechen nicht Sorten von Pollard & Sag 1994, sondern den 'basic concepts' von Carpenter & Pollard 1991.)

### **2 subcat, comps und sct**

In der subcat-Liste von Pollard & Sag (1994: Kapitel 1–8) sind 5 verschiedene 20 Funktionen vereinigt. (i) In ihr ist die Information über Selektionseigenschaften des Heads lokalisiert. (ii) Die Theta-Rollen, die der Head vergibt, sind mit den selegierten Elementen assoziiert. (iii) Dadurch, daß das Subcat Principle auf sie Bezug nimmt, trägt sie zur Geometrie der Konstituentenstruktur bei. (iv) Für sie ist die Obliqueheitshierarchie erklärt, die für die Bindungstheorie relevant ist. (v) Gewisse Extraktionsrestriktionen werden mit ihrer Hilfe – nämlich durch das Trace Principle und durch die Subject Condition – ausgedrückt.

**Randbemerkung** Im Deutschen ist der Zusammenhang zwischen Bindungs- 21 verhältnissen und Konstituentenstruktur (bzw. Wortstellung) kompliziert. Ein Dativobjekt ist hinsichtlich Bindung obliquer als ein Akkusativobjekt:

	- b. \* ich habe den Leuten einander vorgestellt

Aber ein Dativobjekt kann – u. U. sogar bevorzugt – vor einem Akkusativobjekt 22 stehen. Einen besonders interessanten Problemtyp stellen dabei Quantoren als 'sekundare Prädikate' (floating quantifiers) dar:

	- b. \* ich habe deinen Freunden den Film dann allen gezeigt
	- c. ich habe die Filme dann alle deinem Freund gezeigt
	- d. ich habe die Filme deinem Freund dann alle gezeigt

Im folgenden ignoriere ich alle Wortstellungskomplikationen.

In Kapitel 9 werden zunächst sämtliche Funktionen von subcat auf die 3 'Va- 23 lenz'-Merkmale subj, spr und comps verteilt. Dann könnte die Obliqueheitshierarchie zwischen Elementen dieser Listenwerte definiert werden. Für 'local ocommand' im Sinne von (116ii)/(117ii) S. 278f. muß tatsächlich auch das Element des subj-Werts einer VP direkt zugänglich sein. Die Merkmal-Deklarationen für

*headed-struc* und die ID-Schemata müssen dafür sorgen, daß die Valenzmerkmale entsprechend den Obliqueheitsverhältnissen zur Konstituentenstruktur beitragen; sonst könnte z. B. der subj-Wert 'vor' dem comps-Wert abgebunden werden. (Das ist bei P&S nicht ausgeführt.)

24 In Kapitel 9.5 wird die Komplement-Extraktion ohne Spuren vorgeschlagen. Die Intuition ist etwa so: " Remove symbols from the subcat list one by one, doing one of the following: match the symbol with a complement; or place the symbol on the head daughter's slash list." (Pollard 1985: 256; Pollard 1988: 402). Ganz so einfach geht es allerdings nicht. Um empirischen Extraktionsbeschränkungen Rechnung zu tragen, sollen alle Wörter im Normalfall einen leeren slash-Wert haben. Am einfachsten nimmt man an, daß ihr Lexikoneintrag für inher|slash *elist* spezifiziert ist. (Diese Annahme spielt etwa die Rolle, die bei Gazdar et al. (1985) der FCR 6 und dem FSD 3 zukommt. Ausnahme: Spuren – wenn man sie hat.) Bei der spurenlosen Extraktion muß der nicht-leere slash-Wert am Head deshalb durch einen besonderen Lexikoneintrag lizensiert werden. Die regelmäßige Entsprechung eines solchen Lexikoneintrags mit nicht-leerem inher|slash-Wert zu einem Lexikoneintrag mit leerem inher|slash-Wert kann (ähnlich wie bei der Subjekt-Extraktion) mittels einer Lexikonregel ausgedrückt werden, die für comps spezialisiert ist; dadurch entfällt das Trace Principle.


26 Erstens spielt das extrahierte Element für die Bindungstheorie eine Rolle, ähnlich als ob es nicht extrahiert wäre:

	- b. who*<sup>i</sup>* did she introduce \_\_\_ to himself*i*?
	- b. \* them*<sup>i</sup>* [most people]*<sup>i</sup>* pamper \_\_\_

Um Prinzip A (in (6b) und (7a)), Prinzip B (in (7b)) und Prinzip C (in dem strong cross-over-Fall (6a)) anwenden zu können, müssen die content-Werte der extrahierten Ausdrücke in geeigneten Obliqueheitsbeziehungen stehen. Deshalb benötigt man zusätzlich zu der verkürzten comps-Liste noch eine unverkürzte Liste. Zu dem Zweck wird subcat wieder eingeführt (als Attribut von *word*). (Für Prinzip C ist man jetzt auf die revidierte O-Command-Definition (117iii) von Kapitel 6 (S. 279) angewiesen. (117ii) muß entsprechend komplizierter formuliert werden.)


15 Spurenlose Extraktion

auf der subcat-Liste von *bother* ein Gegenstück (ein *synsem*-Objekt mit dem local-Wert von *who*) hat; dieses Gegenstück muß außerdem geslasht sein. (Insofern ist die revidierte Fassung der Subject Condition (12) in Kapitel 9 (S. 350) ein Irrtum.)

(8) who did my talking to \_\_\_ bother \_\_\_?

Auch dafür wird die wieder eingeführte subcat-Liste benutzt; vgl. Pollard & Sag (1994: 380f. Anm. 39).

Es spricht nichts dagegen, auch die Selektionseigenschaften des Heads und die 28 Thetarollen-Zuordnung wie zuvor im subcat-Wert zu lokalisieren. Die einzige Funktion von comps ist dann, zusammen mit dem Subcat- bzw. Valenz-Prinzip zur Geometrie der Konstituentenstruktur beizutragen. Das ist nötig, weil diese Liste bei Extraktion ohne Spur gekürzt sein soll.

P&S beschreiben die Verkürzung der comps-Liste durch die Complement Ex- 29 traction Lexical Rule in Kapitel 9.5.1 (62) von Pollard & Sag (1992: 446) so:

$$\begin{aligned} \text{(9)}\\ \begin{bmatrix} \text{COMPS} \left< \ldots, \left[ \text{Loc} \,\Box \right], \ldots \right> \\\ \text{INHER} \left| \text{sLAS} \,\text{est} \end{bmatrix} \mapsto \begin{bmatrix} \text{COMPS} \left< \ldots, \ldots \right> \\\ \text{INHER} \left| \text{sLASH} \left< \Box \right> \right> \end{bmatrix} \end{aligned}$$

Nach Pollard & Sag (1994: 378): 30

(10)

$$\begin{bmatrix} \texttt{SUBCA7} \left< \ldots, \boxplus \ldots \right> \\ \texttt{COMPS} \left< \ldots, \boxplus \left[ \texttt{Loc} \,\boxplus \ldots \right] \\ \texttt{COMPS} \left< \ldots, \boxplus \left[ \texttt{Loc} \,\boxplus \ldots \right] \end{bmatrix} \mapsto \begin{bmatrix} \texttt{SUBCA7} \left< \ldots, \boxplus \left[ \underset{\texttt{INHER}}{\texttt{INERS}} \left[ \texttt{SLASH} \left\{ \boxplus \right] \right] \right> \\ \texttt{COMPS} \left< \ldots, \cdots \right> \\ \texttt{COMPS} \left< \ldots, \cdots \right> \end{bmatrix} \end{bmatrix}$$

Unterschiede in Pollard & Sag (1994) gegenüber Pollard & Sag (1992): Erstens die 31 slash-Spezifikation im subcat-Wert. Diese Stipulation soll es ermöglichen, die Grundidee der Subject Condition aufrecht zu erhalten. Zweitens soll die Extraktion mehrerer Komplemente desselben Verbs und/oder die Extraktion eines Komplementsubjekts (mittels SELR, (16)) und eines Komplements möglich sein. Bei Verwendung von Spuren ergibt sich das von selbst; um dort mehrfache Extraktion zu beschränken, müßten besondere Maßnahmen ergriffen werden. Empirisch scheint mehrfache Extraktion besonderen Bedingungen zu unterliegen (vgl. z. B. Cinque 1990), so daß es naheliegen würde, dafür ein neues nonlocal-Merkmal mit besonderen Eigenschaften einzuführen.

Um die Erörterung zu erleichtern, ersetze ich im folgenden (wie Pollard 1993) 32 sämtliche relevanten Mengen (z. B. als Wert von slash) durch Listen. Außerdem

ersetze ich das subcat-Attribut von P&S durch ein Attribut sct, das nicht die Elemente von subj und spr enthält. Wenn man für die Obliqueheitshierarchie und die Subject Condition eine einheitliche Liste als Teil eines Worts haben möchte, kann man Wörter so aufbauen:

$$\begin{array}{c} \text{(11)} \quad \begin{bmatrix} \text{word} \\ \text{PHON} \\ \text{PHON} \\ \text{ss} \\ \text{ss} \end{bmatrix} \begin{bmatrix} \text{word} \\ \text{LOC} \text{CAT} \\ \text{LOL} \\ \text{[LOL]} \\ \text{NLOC} \text{[INHER]} \text{LSTM} \text{list} \end{bmatrix} \begin{bmatrix} \text{SUBJ} & \text{list} \\ \text{rowss} & \text{list} \\ \text{comps} & \text{list} \end{bmatrix} \\ \text{sCT} \begin{bmatrix} \text{open} \\ \text{Lerr} \\ \text{sCT+SR} \\ \text{RIGHT} \\ \text{RIGHT} \end{bmatrix} \begin{bmatrix} \text{open} \\ \text{Lerr} \\ \text{list} \\ \text{RIGHT} \end{bmatrix} \begin{bmatrix} \\ \text{list} \\ \text{ss} \end{bmatrix} \\ \text{OBL} \\ \begin{bmatrix} \text{open} \\ \text{Lerr} \\ \text{Lerr} \\ \text{RIGHT} \end{bmatrix} \begin{bmatrix} \text{last} \\ \text{list} \\ \text{assumption} \end{bmatrix} \end{bmatrix} \end{array}$$

33 Die Obliqueheitshierarchie soll dann für den Wert von obl|plus-su|result definiert sein, mit links obliquer als rechts. (Vgl. dazu Absatz 97.) Für die Bestimmung dieses Werts gilt die folgende Implikation. (Die Sorte *append* mit Subsorten *append*<sup>1</sup> und *append*<sup>2</sup> ist wie bei Carpenter (1992: 240) erläutert. Diese Sortenkonstruktion geht auf Ait-Kaci (1984: 118) zurück. Zu " junk"-Attributen wie sct+spr und plus-su vgl. Absatz 100.)

$$\mathsf{word} \Rightarrow \begin{pmatrix} \mathsf{OBL} \mathsf{|secT+\mathsf{SPR}|} \mathsf{LEFT} \approx \mathsf{sCT} & \wedge \\ \mathsf{oBL} \mathsf{|secT+\mathsf{SPR}|} \mathsf{nIGHT} \approx \mathsf{sS} \mathsf{|Loc|} \mathsf{cAT} \mathsf{|value} & \wedge \\ \mathsf{oBL} \mathsf{|secT+\mathsf{SPR}|} \mathsf{nResult} \, \mathsf{T} \approx \mathsf{oBL} \mathsf{|PLUS-\mathsf{SU}|} \mathsf{LEFT} & \wedge \\ \mathsf{oBL} \mathsf{|PLUS-\mathsf{sU}|} \mathsf{nIGHT} \approx \mathsf{sS} \mathsf{|oCC|} \mathsf{cAT} \, \mathsf{vAL} \mathsf{|sysB} \end{pmatrix} \tag{11}$$

Im folgenden verzichte ich auf die Darstellung von obl.

34 Damit die sct-Liste ihre intendierte Wirkung haben kann, müssen bei Lexikoneinträgen, die nicht dem Output-Muster der CELR entsprechen, die ft-Werte von sct mit den entsprechenden ft-Werten von ss|loc|cat|val|comps identisch sein. Die Werte von comps und sct müssen sich also zueinander verhalten wie die Werte von left und result in diesem *append*2-Objekt:

15 Spurenlose Extraktion

(13) *append<sup>2</sup>* left *list* right *elist* result *list* 

Die Beschreibung eines solchen *append*2-Objekts darf aber nicht Teil eines Le- 35 xikoneintrags sein; sonst würden die sct-Liste und die comps-Liste durch die CELR in identischer Weise verkürzt, und das soll grade nicht sein. Wie man das Verhältnis von sct- zu comps-Liste bei Basis-Lexikoneinträgen einerseits und im Resultat der CELR andererseits auf allgemeine Weise regeln kann, ist nicht klar. Vgl. Pollard & Sag (1994: 379 Anm. 38). Ich gehe davon aus, daß das Verhältnis von sct- zu comps-Liste in Basis-Lexikoneinträgen schlimmstenfalls ohne Theorie, aber jedenfalls korrekt geregelt ist.

Im folgenden nehme ich an, daß die Lexikoneinträge von kohärent konstruie- 36 renden Verben – kurz: K-Verben – im wesentlichen nach dem Muster des Perfekt-Hilfsverbs *hat* aufgebaut sind:

5 : ss|loc|cat|val|comps|rt *≈* sct|rt

Dabei drücken die Pfadgleichungen 3 und 4 die Argumentvererbung aus. Die Gleichungen 2 und 5 drücken die Zuordnung von sct-und comps-Elementen aus. Die Gleichung 1 drückt die Thetarollen-Zuordnung aus.

	- (15) *word* : [ss *w-ss*] *phrase* : [ss *p-ss*]

### **3 Lexikonregeln**

42 Lexikonregeln stellen Wohlgeformtheitsbedingungen für das Lexikon dar. Ein Lexikon L ist wohlgeformt hinsichtlich der Lexikonregel LR gdw. es zu jedem

### 15 Spurenlose Extraktion

Element E*<sup>i</sup>* von L, das dem Input-Muster (IM) von LR entspricht, ein Element E*<sup>o</sup>* von L (oder mehrere solche Elemente) gibt, das sich von E*<sup>i</sup>* durch die Angaben im Output-Muster (OM) von LR unterscheidet.

Gedanklich ist es möglich, ein Lexikon – anders als in Absatz 10 und 42 – 43 rekursiv zu definieren als die kleinste Menge LEX*<sup>r</sup>* , für die (i) und (ii) gilt:


So soll man wohl den Vorschlag von Pollard & Sag (1994: S. 395 Anm. 1) verstehen " to treat a set of lexical rules as essentially a closure operator". Wegen (ii) kann LEX*<sup>r</sup>* infinit sein. Intuitiv ist die Funktion von Lexikonregeln in (ii) evtl. einleuchtender als ihre Funktion in Absatz 42. Anstelle des Word-Prinzips (wp) muß man jetzt jedoch das Prinzip (iii) annehmen:

(iii) Jede Modellierende Struktur von der Sorte*word* muß ein Element von LEX*<sup>r</sup>* erfüllen.

Das Word-Prinzip (wp) unterscheidet sich von (iii) dadurch wesentlich, daß es in der Deskriptionssprache formuliert ist. Da LEX*<sup>r</sup>* mittels Lexikonregeln definiert ist und diese in einer (bislang unformalisierten) Meta-Deskriptionssprache formuliert sind, ist die Sprachebene von (iii) mindestens die der Meta-Deskriptionssprache. Ich gehe durchweg von (wp) aus, nicht von (iii).

Vom Raising Principle und der Control Theory – beide werden von P&S als 44 Wohlgeformtheitsbedingungen für Lexikoneinträge in Anspruch genommen – sehe ich hier ab.

Herkömmlich interpretiert man Lexikonregeln (lexical rules) in genauer Ana- 45 logie zu den Regeln der klassischen 'generativen' Phonologie. Eine phonologische Regel der Form

$$\mathbf{a} \rightarrow \mathbf{a}'/\mathbf{b} \begin{bmatrix} \ \ \ \ \ \end{bmatrix} \mathbf{d}$$

versteht man so, daß es zu jeder phonologischen Kette K = BCD eine phonologische Kette K*′* = B *′*C *′*D *′* gibt. Dabei ist B*′* = B und D*′* = D; b ist in B enthalten, d ist in D enthalten, a und c sind in C enthalten, und C*′* ist wie C, nur daß a*′*

anstelle von a in C*′* enthalten ist. Dieses Interpretationsschema kann in mehrfacher Weise differenziert und angereichert werden. In jedem Fall wird durch eine solche Regel ein gedanklich unproblematisches Verhältnis zwischen Ausdrücken in K und K*′* dargestellt. Bei phonologischen Regeln sind die Ausdrücke in der Regel und in den Ketten phonologische Ausdrücke (Merkmalspezifikationen); bei Lexikonregeln sind es Ausdrücke der Deskriptionssprache, nämlich Ausdrücke in Lexikoneinträgen. Vgl. die Explikation von Metaregeln in Gazdar et al. (1985: 68ff). Obwohl die Ausdrücke in den Lexikonregeln und die Ausdrücke in den Lexikoneinträgen syntaktisch gleich sind, ist ihre Semantik natürlich fundamental verschieden: Ein Lexikoneintrag denotiert die Modellierenden Strukturen, die ihn erfüllen; das Input-Muster einer Lexikonregel dagegen denotiert entweder gar nichts oder die Lexikoneinträge, die dem IM entsprechen. (Eine Deskription (ein Lexikoneintrag) und das IM einer Lexikonregel können also auch nicht in einer Subsumptions- oder Unifikationsbeziehung zueinander stehen.)

46 Die Subject Extraction Lexical Rule von P&S setzt jedoch nicht voraus, daß die Ausdrücke des IM in den E*<sup>i</sup>* enthalten sind. Sie setzt vielmehr voraus, daß das IM mit E*<sup>i</sup>* kompatibel ist, d. h., daß es eine (minimale) Deskription E*<sup>i</sup> ′* gibt, in der (nur) die Ausdrücke von E*<sup>i</sup>* und die des IM enthalten sind. E*<sup>o</sup>* unterscheidet sich dann von E*<sup>i</sup> ′* durch die Angaben im OM. In der Formulierung von Pollard & Sag (1994: 383 (69)):

$$\begin{bmatrix} \text{(16)} & \begin{bmatrix} \text{sUB} \left< \mathbf{Y}'' \right>\\ \text{cosps} \left< \dots, \mathbf{X}'' \text{[unmarked]}, \dots \end{bmatrix} \\\\ \text{cosps} \left< \begin{array}{l} \dots , \mathbf{X}'' \text{[unmarked]}, \dots \\ \text{susp} \, elist \end{array} \right> \mapsto \begin{bmatrix} \text{cosps} \left< \dots, \mathbf{X}'' & \dots \\\\ \begin{bmatrix} \text{susp} \left< \begin{bmatrix} \text{Loc} \ \boxed \end{bmatrix} \end{bmatrix} \end{bmatrix} \end{bmatrix} \end{bmatrix}$$

47 Die empirische Annahme ist (i), daß ein Subjekt nur bei abwesender Satzeinleitung extrahiert sein kann ('Comp-trace-Effekt'; vgl. aber Culicover 1993); (ii) daß dies nur bei Matrixprädikaten möglich ist, die mit satzartigen Komplementen ohne Satzeinleitung (Marker) vorkommen können; und (iii) daß fakultatives Vorkommen einer Satzeinleitung durch Unterspezifikation im Lexikoneintrag darzustellen ist. Bei*complain* z. B. muß ein Komplementsatz durch *that* eingeleitet werden, und Subjektextraktion ist nicht möglich; *complain* selegiert einen S[*that*]. Dagegen kommt *think* mit S[*that*] und mit S[*unmarked*] vor; in seinem Lexikoneintrag ist ein S angegeben, der nicht für marking spezifiziert ist. (Daß *think* nicht mit beliebigen anderen Markern als Einleitung des Komplementsatzes vorkommt, muß dann mit irgendwelchen zusätzlichen Mitteln gesichert werden.) Der Lexikoneintrag der Matrixverben muß für die SELR also mit S[*unmarked*] kompatibel sein, ohne diese Spezifikation selbst zu enthalten.

### 15 Spurenlose Extraktion

(Mögliche Alternativen. (i) Man streicht <sup>48</sup> " *unmarked*" in der SELR und verbietet wie Gazdar et al. (1985: 162) ungesättigte V-Projektionen mit marking *that* durch einen Constraint. Dann gibt es zwar einen Lexikoneintrag für*complain* mit extrahiertem Komplementsubjekt, aber keine Modellierende Struktur, die diesen Lexikoneintrag erfüllt. (ii) Man leitet *that*-lose Komplementsätze durch einen leeren Marker (oder Head) ein. Daneben gibt es einen leeren Marker (oder Head), der eine XP selegiert und einen inher|slash-Wert hat, der mit dem local-Wert des subj-Wert der XP identisch ist. Es gibt also keine 'Regel' für die Subjektextraktion. Die Sorte *that* wird in Subsorten *e-that* und *ne-that* zerlegt. Die leeren Marker haben marking *e-that*, der Marker *that* hat marking *ne-that*. *Complain* selegiert S[*ne-that*], *think* selegiert S[*that*].)

In einer expliziteren Notation kann man die SELR so formulieren: 49

Dabei habe ich ergänzt, daß der slash-Wert im IM *elist* ist und daß das Objekt, dessen Subjekt extrahiert ist, propositional ist.

Die drei Punkte in dem Ausdruck <sup>50</sup> " comps *< . . .*" von (16) sind hier durch eine Pfadvariable *π* wiedergegeben, die im IM wie im OM gleichförmig als eine Folge von *n* RT-Attributen zu interpretieren ist, mit 0 *≤ n*. Auf eine solche Variable könnte man nur dann verzichten, wenn man die SELR von (16) nicht als eine Lexikonregel, sondern als eine Menge von Lexikonregeln auffassen würde, die sich dadurch voneinander unterscheiden, daß sie null oder ein oder zwei oder … rt-Attribute anstelle von *π* haben. Da es für die Länge dieses Pfades keine begründbare Obergrenze gibt, ist das unsinnig.

51 Die CELR ist weniger einfach. Eine explizitere Formulierung von (10) sieht so aus:

(17) ss loc|cat|val|comps|*π* [ ft|loc *a* rt *b* ] nloc|inher|slash *c* sct|*π*1|ft *≈* ss|loc|cat|val|comps|*π*|ft *7→* ss loc|cat|val|comps|*π b* nloc|inher|slash [ ft *a* rt *c* ] sct|*π*1|ft|loc *≈* sct|*π*1|ft|nloc|inher|slash|ft

52 Die Pfadvariablen *π* und *π*<sup>1</sup> repräsentieren wieder Ausdrücke, die aus null oder mehr rt-Attributen bestehen. Wegen der Möglichkeit, daß mehr als ein Objekt extrahiert ist, kann die sct-Liste länger als die comps-Liste sein. Dann muß auch *π*<sup>1</sup> länger als *π* sein können. Da die Pfadgleichung des IM außerdem mit einem Input-Lexikoneintrag nur kompatibel und nicht in ihm enthalten sein muß, ist es schon in einfachen Fällen aufwendig, die sinnvolle Anwendung dieser Lexikonregel zu sichern. Um die folgenden Überlegungen zu vereinfachen, unterdrücke ich deshalb die mehrfache Extraktion. (Das Ergebnis in Absatz 68 wird dadurch nicht beeinflußt.) Dann ist immer *π*<sup>1</sup> = *π*. Daher kann man die Pfadgleichung im IM weglassen: Sie dient lediglich dazu, das Element der sct-Liste zu identifizieren, dessen local-Wert im OM mit seinem slash-Wert identifiziert wird. Die revidierte Fassung der CELR von (10) ist dann so:

$$\begin{aligned} \text{(elec)}\\ &\quad \begin{bmatrix} \text{(elec)} & \text{[LOC]} \text{CAT} |\text{COMPS}|\pi & \begin{bmatrix} \text{FT} \text{[LOC]} \ \boxed{\text{0}} \\ \text{RT} & \text{[\$\boxed{\text{0}}} \end{bmatrix} \\ &\quad \begin{bmatrix} \text{NLOC} |\text{INHER}|\text{SLASH} & \text{ell} \\ \text{ss} & \text{[} \end{bmatrix} \end{bmatrix} \end{aligned}$$

$$\leftrightarrow \left[ \text{ss} \begin{bmatrix} \text{LOC} |\text{CAT} |\text{VAL} |\text{COMPS} |\pi & \boxed{\text{0}} \\ \text{NLOC} |\text{INHER}|\text{SLASH} & \begin{bmatrix} \text{FT} \ \boxed{\text{0}} \\ \text{RT} & \text{ell} \end{bmatrix} \end{bmatrix} \right]$$

sct|*π*|ft|loc *≈* sct|*π*|ft|nloc|inher|slash|ft

Wenn man die Pfadgleichung im OM wegläßt, hat man eine explizite Formulierung der CELR-Fassung von Pollard & Sag (1992) (9).

53 Durch (celr) sollen dem Basis-Lexikoneintrag von *gibt*, den ich wie in (g-b) ansetze (s. u.), die beiden geslashten Lexikoneinträge in (g-d) und (g-a) zugeordnet werden. Da von der comps-Liste ein Ausdruck (der local-Wert *a* ) entfernt

### 15 Spurenlose Extraktion

werden soll, nehme ich jetzt, anders als in (14), an, daß die Komplementselektionseigenschaften des Verbs für die comps-Liste (nicht für die sct-Liste) formuliert sind. (Diese Annahme ist nicht zwingend, da die Ausdrücke des IM in einem Lexikoneintrag nicht enthalten sein müssen, sondern mit ihm nur kompatibel sein müssen (Absatz 46). Ich möchte den Verzicht auf die Enthaltenseins-Forderung aber nicht schon durch die Form der Lexikoneinträge erzwingen.)

Basis-Lexikoneintrag von *gibt*: 54

5 : sct|rt|ft *≈* ss|loc|cat|val|comps|rt|ft

Die Pfadgleichungen 1 – 3 drücken die Thetarollen-Zuordnung aus; 4 und 5 die Zuordnung von sct- und comps-Elementen.

55 Lexikoneintrag von *gibt* mit Extraktion des Dativobjekts:

1 : ss|loc|content|nucleus|giver

*≈* ss|loc|cat|val|subj|ft|loc|content|index


15 Spurenlose Extraktion

1 : ss|loc|content|nucleus|giver

*≈* ss|loc|cat|val|subj|ft|loc|content|index


Man sieht, daß die durch (celr) zu bestimmenden Unterschiede nicht nur den comps-Wert und den slash-Wert betreffen, sondern auch die Pfadgleichungen 4 und 5 . (Die Gleichung 6 ist durch die Gleichung im OM von (celr) bedingt.)

Ich betrachte zunächst (g-a). Unter die (celr) mit π = rt fällt der Lexikonein- 57 trag (g-b). Der Ausdruck *<sup>a</sup>* ist in (g-b) dann der local-Wertausdruck " Nakk". Dieser Ausdruck bildet in (g-a) den Wert von slash|ft. Der Ausdruck *b* in (g-b) ist " *elist*"; er bildet in (g-a) den Wert von comps|rt. Soweit trägt (g-a) der Tatsache Rechnung, daß das extrahierte Element die Forderung von *gibt* nach einem Akkusativobjekt erfüllt. In (g-b) ist der ss-Wert- und damit auch der local-Wert

des Akkusativobjekts durch die Pfadgleichung 5 mit dem zweiten sct-Element identifiziert. Es wäre unsinnig, diese Pfadgleichung in (g-a) zu übernehmen; sie muß durch 5 *′′* ersetzt werden. Man muß dafür eine Pfadgleichungskonvention folgender Art annehmen:

	- (ii) Wenn A oder ein Bestandteil von A in E*<sup>o</sup>* in einer (anderen) Position *P* steht, dann gibt es in E*<sup>o</sup>* Pfadgleichungen *G′* , die wie *G* sind, aber der Position *P* entsprechen.
	- (18) a. daß er es ihr gibt
		- b. was [er \_\_\_ ihr gibt]
		- c. wem [er es \_\_\_ gibt]

### 15 Spurenlose Extraktion

5 : ss|loc|cat|val|comps|rt *≈* sct|rt

Die (celr) mit dem leeren Pfad als *π* ordnet (h-b) den Lexikoneintrag (h-v) zu: 62


Die Pfadgleichung 2 *′* ergibt sich daraus, daß der Ausdruck *a* in anderer Position steht; die Gleichung 5 *′* daraus, daß *b* in anderer Position steht.

	- (19) a. daß er es ihr [gegeben hat]
		- b. gegeben (glaube ich daß) er es ihr [\_\_\_ hat]
		- c. ihr gegeben (glaube ich daß) er es [\_\_\_hat]
		- d. es ihr gegeben (glaube ich kaum daß) er [\_\_\_ hat]

### 15 Spurenlose Extraktion

dieser Interpretation von π ist das IM von (celr) nicht in (h-b) enthalten, aber es ist damit kompatibel. Das heißt, es gibt eine Deskription (h-b'), die die Ausdrücke von (h-b) und vom IM der (celr) enthält:


Diese Deskription unterscheidet sich von (h-b) nur durch die längere comps-Liste. 65 Gemäß dem OM von (celr) scheint dann ein Lexikoneintrag wie (h-c) als regelmäßige Entsprechung zu (h-b) ausgewiesen zu sein:


Die Pfadgleichungen in (h-c) sind identisch mit denen von (h-b), nur daß 6 aus dem OM von (celr) hinzugekommen ist. (Wenn (9) statt (10) zugrundegelegt wäre, würde auch dieser Unterschied entfallen.) Keiner der 'bewegten' Ausdrücke geht in eine Pfadgleichung ein. Der Ausdruck *<sup>a</sup>* – nämlich " *local*" – ist in (h-b') der Wert von comps|rt|rt|ft|loc und in (h-c) der Wert von slash|ft. Der Ausdruck *<sup>b</sup>* – nämlich " *list*" – ist in (h-b') der Wert von comps|rt|rt|rt und in (h-c) der Wert von comps|rt|rt. In (h-b) sind diese Ausdrücke nicht vorhanden, und es

### 15 Spurenlose Extraktion

gibt kein Prinzip, aus dem hervorgehen würde, daß sie in (h-b') in eine Gleichung eingehen müßten.

Wenn das richtig ist, ist wegen 2 , 3 und 5 der comps|rt-Wert dieses *hat* je- 66 doch identisch mit dem comps-Wert des selegierten Verbs, und das dritte Element auf der comps-Liste von *hat* ist wegen 6 geslasht. (Unsinnigerweise hat der slash-Wert von *hat* keinerlei Beziehung dazu. Diesem Mangel könnte man durch Verwendung der Gleichung im IM von (17) abhelfen.) Demnach müßte *hat* ein (mindestens) zweistelliges Verb und mindestens zwei (von diesem Verb geerbte) Objekte selegieren, deren zweites die Eigenschaften einer Spur hat. Da es Komplementspuren laut Annahme aber nicht gibt, gibt es keine Modellierende Struktur, die diesen Lexikoneintrag erfüllt.

Tatsächlich steht die Pfadgleichung 5 von (h-c) jedoch nicht in Übereinstim- 67 mung mit der (pgk). In (h-b') geht der Ausdruck (20) als Wert in die Gleichung 5 ein.


Dieser Ausdruck ist in (h-c) nicht (insbesondere nicht an derselben Stelle) enthalten. Nach (pgk) (i) müßte die Gleichung 5 deshalb entfallen. Ein Teilausdruck davon, nämlich *a* " *local*", tritt in (h-c) als Wert von slash|ft auf. Nach (pgk) (ii) sollte dann durch eine Gleichung 5 *′* Identität des slash|ft-Werts und des sct|rt-Werts ausgesagt sein. Da die Sorten dieser Werte inkompatibel sind (*local* und *list*), ist diese Forderung nicht erfüllbar. Außerdem sind zwei Teilausdrücke, nämlich " ft *synsem*" und " rt *list*", in (h-c) im Wert von comps|rt enthalten. Demnach sollte eine Gleichung den Wert von comps|rt und den von sct|rt identifizieren; insofern scheint 5 in (h-c) durchaus berechtigt zu sein, mit den oben besprochenen Folgen.

Wenn dieses Verständnis von (pgk) richtig ist (und (pgk) sich präzisieren läßt), 68 wird ein Lexikoneintrag E*<sup>o</sup>* nur dann durch (celr) als regelmäßige Entsprechung zu einem Lexikoneintrag E*<sup>i</sup>* ausgewiesen, wenn das IM der (celr) in E*<sup>i</sup>* enthalten ist. Ein Beispiel wie (21a) kann dann nur auf einen (entsprechend der (celr)) geslashten Lexikoneintrag von *gegeben* zurückgeführt werden:

(21) a. was [er \_\_\_ ihr [gegeben hat]]

b. was [du dich immer geweigert hast [\_\_\_ deinen Eltern zu gestehen]]

(Die Möglichkeit, das Komplement eines infiniten Verbs zu extrahieren, ist unabhängig durch Fälle wie (21b) gesichert.) Nach dieser Analyse hat *hat* in (21a) eine zweistellige sct-Liste, deren erstes Element – der ss-Wert von *gegeben* – geslasht ist. Bei Verwendung von Spuren hätte *hat* eine dreistellige comps-Liste, und *gegeben* wäre nicht geslasht.

### **4 Unterspezifizierter LE plus Constraints (U+C)**

69 Die massiven Explikationsprobleme der Lexikonregeln rühren daher, daß sie eine Beziehung zwischen Lexikoneinträgen ausdrücken, also auf Ausdrücken der Deskriptionssprache operieren; vgl. Pollard & Sag (1994: 395 Anm. 1). Man kann prüfen, wie ihre intendierten Effekte in der Deskriptionssprache selbst erreicht werden können. Eine Möglichkeit ist, das Konzept des Lexikoneintrags konsequent auszunutzen. Verschiedene Vorkommen desselben lexikalischen Elements unterscheiden sich gewöhnlich in einigen Details; vgl. Absatz 1. Sie können einen einzigen Lexikoneintrag erfüllen, weil dieser in manchen Hinsichten unterspezifiziert ist. Statt für geslashte und ungeslashte Wörter verschiedene Lexikoneinträge zu formulieren, kann man für Wörter, die geslasht sein können, einen einzigen stark unterspezifizierten Lexikoneintrag nach folgendem Muster benutzen:

### 15 Spurenlose Extraktion

Im allgemeinen sind nur die als *α*–*ζ* gekennzeichneten Teile genauer spezifiziert. (Ich nehme wie in (14) an, daß Selektionseigenschaften im sct-Wert ausgedrückt sind.)

Der Wert *ex* des Attributs ex hat die Untersorten *nix* und *slex*. Während *nix* 70 atomar ist, ist *slex* so aufgebaut:

$$\text{size} \Rightarrow \begin{bmatrix} \text{(23)}\\ \text{ELEMENT-VON} \\\\ \text{sleex} \Rightarrow \\\\ \text{IN-COMS} \\\\ \text{IN-COMS} \\\\ \text{RIGHT} \end{bmatrix} \begin{bmatrix} \text{append} \\ \text{LEFT} & \text{(\square\)} \\\\ \text{RIGHT} & \text{nelist} \\\\ \text{LEFT} & \text{[\square\]} \\\\ \text{RIGHT} & \text{list} \\\\ \text{RESSLT} & \text{list} \end{bmatrix} \tag{23}$$

Das *slex*-Objekt wird so eingesetzt, daß durch den right|ft-Wert von element- 71 von ein Element einer Liste identifiziert wird, die identisch mit dem Wert von element-von|result ist. Der element-von|left-Wert hat dabei etwa die Funktion, die die Pfadvariable *π* bei der (selr) und der (celr) hat. Der in-comps|result-Wert wird dann aus dem left-Wert und dem element-von|right|rt-Wert aufgebaut und mit dem comps-Wert identifiziert; s. u. (sl-s) und (sl-o).

Durch geeignete Constraints zerlegt man die Menge der Wörter (d. h. der Mo- 72 dellierenden Strukturen von der Sorte *word*), die einen Lexikoneintrag der Form (22) erfüllen können, in geslashte und ungeslashte Wörter; bei ersteren kann man dann zwei Arten (mit Extraktion eines Objekts bzw. Extraktion des Subjekts eines propositionalen Objekts) unterscheiden. Damit erhält man zugleich (im Unterschied zu Absatz 35) eine allgemeine Theorie für die Zuordnung zwischen den Elementen der sct- und comps-Listen und außerdem – anders als in Absatz 24 – eine allgemeine Theorie für die inher|slash-Werte in Wörtern.

Für ungeslashte Wörter gilt folgende Implikation: 73

$$\begin{pmatrix} \texttt{sl-e} \\ \texttt{word} \land \texttt{ex} \ \texttt{nix} \end{pmatrix} \Rightarrow \begin{pmatrix} \texttt{ss} \texttt{|NLocc|} \texttt{INHER} \texttt{|SLSH} \ \texttt{elist} \land \\ \texttt{scr} \texttt{\approx ss} \texttt{|Loc} \texttt{|CAT} \texttt{vAL} \texttt{|COMP} \end{pmatrix}$$

Geslashte Wörter mit Extraktion eines Komplementsubjekts müssen folgende 74 Deskription erfüllen:


### 15 Spurenlose Extraktion

Die Extraktion von mehreren Objekten (oder eines Objekts und eines Komplement-Subjekts) ist hier nicht möglich.

Für geslashte Wörter gilt also folgende Implikation: 77

(sl-n) (*word ∧* ex *slex*) *⇒* (sl-s *∨* sl-o)

Lexikoneintrag für *gibt* entsprechend (22): 78

1 : ss|loc|content|nucleus|giver

*≈* ss|loc|cat|val|subj|ft|loc|content|index

2 : ss|loc|content|nucleus|given *≈* sct|rt|ft|loc|content|index

3 : ss|loc|content|nucleus|givee *≈* sct|ft|loc|content|index


	- (26) a. was [er \_\_\_ ihr [gegeben hat]] b. wem [er es \_\_\_ [gegeben hat]]

Das *hat* in (26a) erfüllt die Implikation (sl-n) mit der Deskription (sl-o) und einer 2-stelligen Liste als Wert von ex|element-von|left; dabei efüllt *gegeben* die Implikation (sl-e), und der local-Wert von *was* ist auf den sct-Listen von beiden Verben repräsentiert. Wenn in (26a) *hat* die Implikation (sl-e) erfüllt, dann erfüllt *gegeben* die Implikation (sl-n) so wie *gibt* in (18b), und der local-Wert von *was* ist nur auf der sct-Liste von *gegeben* repräsentiert. Entsprechend bei (26b).

83 Sinngemäß genauso bei (27c) u. ä., unabhängig davon, ob die Konstituentenstruktur wie in (27a) oder wie in (27b) ist:

	- b. daß er es ihr [geben [dürfen soll]]
	- c. was er \_\_\_ ihr [geben dürfen soll]

### 15 Spurenlose Extraktion

Wenn *geben* geslasht ist, also (sl-o) erfüllt, dann sind *dürfen* und *soll* ungeslasht, erfüllen also (sl-e). Wenn *dürfen* geslasht ist, sind *geben* und *soll* es nicht; und wenn *soll* geslasht ist, sind *geben* und *dürfen* es nicht.

Die Extraktion mittels des U+C-Verfahrens ist bei K-Verben daher systema- 84 tisch mehrdeutig. Bei Extraktion mittels Spur geht sie eindeutig vom maximal regierenden Verb aus; bei Extraktion mittels Lexikonregel geht sie eindeutig vom minimal regierenden Verb aus.

Falls diese Ambiguität unerwünscht ist, kann man sie nicht etwa dadurch be- 85 seitigen, daß man den ex-Wert *slex* nur bei finiten Verben zuläßt, denn infinite Verben lassen bei 'inkohärenter' Konstruktion Komplementextraktion zu; vgl. (21b). Allerdings könnte man dem Lexikoneintrag von K-Verben die Beschreibung

### (28) sct|ft|nloc|inher|slash *elist*

hinzufügen. Damit würde, wie bei Spuren, die Extraktion innerhalb eines Kohärenzfelds eindeutig vom maximal regierenden Verb ausgehen.

Die Implikationen (sl-e) und (sl-n) haben eine komplexe Deskription als Ante- 86 zedens. Es kann im U+C-Verfahren sinnvoll sein, statt dessen oder in Ergänzung dazu Subsorten von *word* einzuführen, die als Antezedens solcher Implikationen dienen, und es könnte nützlich sein, dabei multiple Vererbung zuzulassen. Auf diese Weise könnte die angenommene " hierarchy of lexical sorts (subsorts of *word*) […] roughly as described in Pollard & Sag (1987: Chapter 8)" (Pollard & Sag 1994: 395) sinnvoll eingesetzt werden. Es ist aber zu beachten, daß weder die Lexikoneinträge noch die Implikationen des U+C-Verfahrens formal etwas mit den ' generic lexical entries' von Pollard & Sag (1994: 36f.) (Absatz 11) zu tun haben. Über die heißt es (S. 36): " each generic lexical entry specifies […] values of certain features or relationships among values of different features […] that must hold of all lexical entries that instantiate the generic entry. The hierarchical organization of lexical entries (both generic and actual) has the effect of amalgamating the information associated with one actual entry with the information associated with all of the generic entries that it instantiates". Anders als Lexikoneinträge im Sinne von Absatz 10 und Implikationen denotieren die 'generic lexical entries' also keine Modellierenden Strukturen. Vielmehr soll die in ihnen enthaltene 'Information' mit der von Lexikoneinträgen " verschmelzen", die zu ihnen in einer 'Instantiierungs'-Relation stehen. Weder der Begriff der Instantiierung noch der der Information oder der des Verschmelzens ist formal expliziert.

### **5** *word* **in** *word* **(W-in-W)**

87 Alternativ kann man Vorschläge von Manfred Sailer und Detmar Meurers (p. M. 30.5.94) aufnehmen und in ein Wort ein *word*-Objekt einbetten. Dafür zerlege ich die Sorte *word* in die Subsorten *normal-word* und *slashed-word* (kurz: *sld-word*) und baue Wörter mit Objektextraktion nach folgendem Muster auf:

ex|element-von|right|ft|nloc|inher|slash|ft

*≈* ex|element-von|right|ft|loc

### 15 Spurenlose Extraktion

Wenn eine Modellierende Struktur *MS* ein Wort *W<sup>o</sup>* enthält, das die Deskripti- 88 on (sw1) erfüllt, dann enthält *W<sup>o</sup>* – also auch *MS* – als Wert von wort ein Wort *W<sup>i</sup>* , das seinerseits das Word-Prinzip (wp) erfüllen muß, zu dem es also einen Lexikoneintrag LE<sup>v</sup> geben muß. (*W<sup>i</sup>* kann, wenn man es nicht explizit verhindert, wiederum von der Sorte *sld-word* sein. Insofern kann man (sw1) als eine rekursive Verallgemeinerung von (sl-o) auffassen.) Der Wert von wort ist jedoch nicht selbst ein Element des Lexikons (vgl. Absatz 10); deshalb ist (sw1) keine Lexikonregel. Eher hat (sw1) Ähnlichkeit mit klassischen Transformationsregeln, indem *MS* eine 'Vorgängerstruktur' von *W<sup>o</sup>* enthält, die die Eigenschaften des 'Vorgänger-Lexikoneintrags' LE<sup>v</sup> erfüllt. (Tatsächlich kann man diese Methode so verallgemeinern, daß ein *sign* als Wert eines 'Junk-Slots' in ein *sign* eingebettet ist. Damit kann man eine formale Rekonstruktion transformationeller Grammatiken entwickeln.) Nach dem Sprachgebrauch von Pollard & Sag (1994: 4) ist eine Deskription wie (sw1) 'multi-stratal' und damit 'derivational'.

Man kann (sw1) auf zwei verschiedene Weisen gebrauchen: im U+C-Verfahren 89 als Konsequens einer Implikation für die Sorte *sld-word* oder aber als eigenen Lexikoneintrag. Wenn der Lexikoneintrag von *gibt* usw. für die unterspezifizierte Obersorte*word* formuliert ist, wird man parallel zu (sl-n) und (sl-e) Implikationen für *sld-word* und *normal-word* formulieren. (Also etwa *slashed-word ⇒* (sw1); und *normal-word* wie (sl-e), aber ohne das Attribut ex.) Für ein geslashtes Vorkommen von *gibt* wie in (18b) ist der Lexikoneintrag von *gibt* dann zweimal relevant, denn sowohl *W<sup>o</sup>* als auch *W<sup>i</sup>* muß ihn erfüllen. Die comps-Liste des Lexikoneintrags muß deshalb unspezifiziert sein.

Ich will statt dessen (sw1) als einen Lexikoneintrag ähnlich wie Trace bei Pol- 90 lard & Sag (1994) verwenden (den z. B. das geslashte *gibt* erfüllt) und Lexikoneinträge von der Sorte *normal-word* für ungeslashte Wörter annehmen. Die Lexikoneinträge sind also für die Subsorten spezifiziert. Für *sld-word* nehme ich keine besondere Implikation an (sondern nur Merkmal-Deklarationen). (Für eine Variante dieses Verfahrens vgl. jetzt Meurers 1994: 77–80.)

Beim U+C-Verfahren müssen die Beschreibungen in den Implikationen (sl-e) 91 und (sl-n) (bzw. in den Implikationen für *normal-word* und *sld-word*) monoton gegenüber dem Lexikoneintrag von der Sorte *word* sein. In (sw1) könnte man das Verhältnis zwischen dem ss-Wert und dem wort-Wert bzgl. der comps-Liste intuitiv als 'nicht-monoton' betrachten (obwohl keinerlei nicht-monotone Mechanismen involviert sind): Hier gibt es, wenn der Wert von wort die Sorte *normal-word* hat, eine ungekürzte comps-Liste (den Wert von wort|ss|loc|cat|val| comps). Wenn man (sw1) als Lexikoneintrag benutzt, kann man daher auf das sct-Attribut verzichten; vorausgesetzt, man wendet die Bindungstheorie und die

Subject Condition nur auf die unreduzierte und nicht (auch) auf die reduzierte comps-Liste an.


95 Pollard & Sag (1994: 387) schlagen in Kapitel 9.5.2 (80) eine grob skizzierte Adjunct Extraction Lexical Rule vor, bei der in Analogie zur SELR das Matrixverb zu einem Objektsatz geslasht ist, aus dem ein Adjunkt extrahiert ist. Es gibt jedoch syntaktische Indizien dafür, daß der nicht-leere inher|slash-Wert in dem Objektsatz seinen Ursprung hat (Hukari & Levine 1993). Eine entsprechende Lexikonregel genau zu formulieren (vgl. Höhle 1994) ist schwierig. Als ein dritter Lexikoneintrag der Sorte *sld-word* sähe das so aus:


96 Diese Analyse läßt allerdings nicht zu, daß das extrahierte Adjunkt in (30) außerhalb des Skopus von " irgendwelche Aufsätze" liegt:

(30) morgen früh denkt sie daß sie \_\_\_ irgendwelche Aufsätze liest

Darüber hinaus ist die Theorie der Bedeutungskomposition von modifiziertem und modifizierendem Ausdruck, die dabei vorausgesetzt ist (Pollard & Sag 1994: Kapitel 8.3), äußerst zweifelhaft. (Bei Verwendung von Spuren treten diese Probleme nicht auf.)

15 Spurenlose Extraktion

### **6 Komplemente in einem Listenwert von** *append*

Meurers (1993) folgend, habe ich durchweg die Ordnung von Pollard & Sag (1987) 97 auf der sct- bzw. comps-Liste angenommen, bei der links obliquer als rechts ist. Der Grund dafür ist, daß sich damit die Argumentanhebung bei K-Verben einfach und natürlich darstellen läßt. Wenn man die umgekehrte Ordnung von Pollard & Sag (1994) benutzt und dabei die selegierte V-Projektion am Ende der Liste haben möchte, muß man besondere Hilfsmittel benutzen.

Eine Möglichkeit ist, ein Attribut k-verb mit einem Wert der Sorte *append* 98 einzuführen. Der Lexikoneintrag von *hat* wäre dann nicht wie in (25), sondern so zu formulieren:


Für die Extraktion nach dem U+C-Verfahren ändert sich dadurch nichts. Beim W-in-W-Verfahren würde man für *normal-word* in der Gleichung 4 " sct" durch ss|loc|cat|val|comps" ersetzen; ansonsten ergibt sich auch da keine Änderung.

" Für die Benutzung von Lexikonregeln wäre der Lexikoneintrag von *hat* nicht 99 wie (h-b), sondern so zu formulieren:

1 : ss|loc|content|nucleus|soa-arg *≈* k-verb|right|ft|loc|content


```
6 : sct ≈ k-verb|result
```
7 : sct *≈* ss|loc|cat|val|comps

Die Gleichungen 2 und 5 von (h-b):


dürfen nicht Teil dieses Lexikoneintrags sein, da weder die Länge der result-Liste (die mit der sct- und der comps-Liste identisch ist) noch ihr erstes Element bekannt ist. Wenn das IM von (celr) mit *π* = rt|rt mit diesem Lexikoneintrag vereinigt wird, sollte ein Lexikoneintrag eines geslashten *hat* zugeordnet sein,

### 15 Spurenlose Extraktion

mit dem (19b) analysiert werden kann. Dabei treten jedoch die Probleme auf, die in Zusammenhang mit (21a) zur Sprache gekommen sind. Die Beispiele (19b–d) sind mit der (celr) unter Voraussetzung von diesem Lexikoneintrag nicht analysierbar. Alternative Formulierungen führen zu denselben Problemen. Allenfalls eine besondere Lexikonregel, die auf dem Wert von k-verb|right|ft operiert, könnte erfolgreich sein.

In der Literatur ist es üblicher, anstelle eines *append*-Objekts als Teil der Mo- 100 dellierenden Struktur eine Definite Relation append als Bestandteil der Deskriptionssprache im Lexikoneintrag anzunehmen. Die Intuition ist dabei – wie auch bei Lexikonregeln –, daß man zwar einen Zusammenhang zwischen verschiedenen Eigenschaften von Modellierenden Strukturen beobachtet, diesen Zusammenhang aber nur in einer Theorie über die Strukturen und nicht in den Strukturen selbst zum Ausdruck bringen möchte. Die Annahme von speziellen Attributen (" junk slots") wie wort, ex und k-verb sowie Sorten wie *slex* und *append* (und deren Attributen) z. B. in (sw1) und Absatz 98 wird von manchen Autoren als ontologisch anstößig empfunden.

Obwohl Definite Relationen und Funktionen (so wie Lexikonregeln) nicht zu 101 den formalisierten Teilen der HPSG-Theorie gehören, nimmt man gewöhnlich an, daß eine Beschreibung eines *append*-Objekts mit den Listen A, B, C und eine Beschreibung der Listen A, B, C mittels eines append-Ausdrucks äquivalente Aussagen über A, B, C machen. Wenn das korrekt ist, ergeben sich dieselben Schlüsse für die Selektion von Verb-Projektionen durch K-Verben und die spurenlose Extraktion.

### **Literatur**


Cinque, Guglielmo. 1990. *Types of A′ -dependencies*. Cambridge, MA: MIT Press.


### **Chapter 16**

## **Complement extraction lexical rule and variable argument raising**

### Tilman N. Höhle

When (i) clause union phenomena are described by lexical entries involving vari- 1 able argument raising in the manner of Hinrichs & Nakazawa (1993) and (ii) object extraction is accounted for without trace by lexical rule (CELR), the empirical consequences that many authors wished to achieve by these formal constructs are systematically unavailable.

One probable consequence is that the CELR has to be dropped. Among various 2 alternative formal options, extraction by trace appears to be superior.

The grammar of Pollard & Sag (1994) has two components: a set of descriptions 3 Descr and a collection of metadescriptive expressions Meta. Any feature structure is grammatically well-formed only if it satisfies every member of Descr. Among the members of Descr are, e.g., the HFP, the Subcat Principle, the ID Principle, the Trace Principle, the various parts of the Binding Theory.

Pollard & Sag (1994) assumes that a Lexicon – i.e., a collection of lexical en- 4 tries – is part of the grammar (an assumption that might be debated); and members of Meta are meant to express statements about the Lexicon and its members, namely:

(i) a collection of "generic lexical entries" (Pollard & Sag 1994: 36f.). "Actual lexical entries" are in a relation "instantiate" to generic lexical entries, and the "information" associated with either of them is "amalgamated" in the former.

<sup>§</sup> *Editors' note:* This is the previously unpublished paper version of a talk given at the HPSG workshop in Tübingen on June 21, 1995. The citation style was adjusted to the conventions in this volume, and closing brackets (omitted in the original) were added to all AVMs. The text used to be available from a web page with the note: 'The background of this has been developed in lecture notes (Spurenlose Extraktion [Höhle 1994]) in 1994.'

Tilman N. Höhle. 2019. Complement extraction lexical rule and variable argument raising. In Stefan Müller, Marga Reis & Frank Richter (eds.), *Beiträge zur deutschen Grammatik. Gesammelte Schriften von Tilman N. Höhle. Second revised edition*, 539–551. Berlin: Language Science Press. DOI:10.5281/zenodo.2588377

Clearly, generic lexical entries are descendants of the 'generic lexical frames' in Flickinger et al. (1985), the '(definitions of) word classes' in Flickinger (1987) and Flickinger & Nerbonne (1992), and the '(definitions of) lexical types' in Pollard & Sag (1987: 192–196, 198f. and 200–208). (N.b. that although the types of Pollard & Sag 1987 in general correspond to the sorts of Pollard & Sag 1994, the lexical types of Pollard & Sag 1987 correspond to generic lexical entries of Pollard & Sag 1994 rather than to sorts.)

	- (iWP) Any feature structure of sort *word* must satisfy a lexical entry. (Hence, a lexical entry is a description.)

If the WP is thought to be a member of Descr, it can be formalized:

(fWP) :*word ⇒* (D<sup>1</sup> *∨* …*∨* D*n*)

In this case, the Lexicon – i.e., the set of D*<sup>i</sup>* in the fWP – is necessarily finite. But if lexical rules are used to define the Lexicon inductively, as in Pollard & Sag (1994: 395 n. 1), the WP must be a member of Meta, and there is no known way to formalize it. (Cf. Pollard 1993.)

6 In section 9.5.1 of Pollard & Sag (1994), traces are abolished; i.e., the Trace Principle is tacitly replaced by a No Trace Principle to the effect that there is no sign whose loc value is a member of its inher slash value:

(NTP) *¬*:ss loc *≈* :ss nonloc inher slash first

Unslashed words with a trace complement are substituted by slashed words. Pollard & Sag (1994) attempts to motivate this move by data discussed by Pickering & Barry (1991). However, this attempt is inconsistent with the word order theory of HPSG. Pickering & Barry's (1991) data are problematic for theories (like, e.g., GPSG) in which phonologically empty constituents are subject to constituent order principles just like nonempty constituents are. But from the HPSG word order theory it follows that empty constituents have no word order properties at all (cf. Pollard & Moshier 1990: 291f.); hence it *predicts* the possible existence of

### 16 Complement extraction lexical rule and variable argument raising

Pickering & Barry's (1991) data. – Even though dropping traces is unmotivated, one might wish to explore its consequences.

Thus, while the word *gibt* in (1a) is unslashed, the word *gibt* in (1b) is slashed, 7 and so are their respective lexical entries in (2).

	- b. wem [er es gibt]

b. lexical entry of slashed *gibt* as in (1b):

 

	- (3) a. daß [er es ihr gegeben hat]
		- b. gegeben (glaubt sie) daß [er es ihr hat]
		- c. es ihr gegeben (glaubt sie) daß [er hat]
		- d. wem [er es gegeben hat]
	- (4) lexical entry of unslashed *hat* 'have' as in (3a):


### 16 Complement extraction lexical rule and variable argument raising

assume that the projection is in fact a word. To enforce this, I partition the sort *synsem* into *w-ss* and *p-ss* and assume these feature declarations:

$$\begin{array}{rcl} \text{(5)} & \text{Approxp(ss, } phrace) = p\text{-ss} \\ \text{Appprop(ss, } word) & \text{= } \omega\text{-ss} \end{array}$$

There is no *category* attribute lexical (since no reason for having it is known).

The relation between (2a) and (2b) and between (4) and (6) is regular: for each 13 lexical entry like (2a) and (4) there is a lexical entry like (2b) and (6), respectively. To express generalizations like this, Pollard & Sag (1994) uses lexical rules whose syntax and intended semantics vaguely resemble GPSG's metarules. Syntactically, a lexical rule is a pair <Pattern, Target> whose members are expressions written in the syntax of the description language, enriched with regular expressions. A first version of the Object Extraction Lexical Rule (which is similar to the CELR of Pollard & Sag 1992: 446) might be formulated as in (7):

> 

(7) OELR, first version:

(By (7), there must be lexical entries that allow subjects to be extracted in violation of the Comp-trace filter. I ignore this effect, as it is immaterial to my concerns.)

Expressions of the form "(α) 14 *<sup>n</sup>* " signify a sequence of *n* occurrences of expression α, with *n ≥* 0. Identity of tags across Pattern and Target signifies that identi-

cal description language expressions occur in place of the tags. (In the Coercion Lexical Rule of Pollard & Sag (1994: 314), tag identity across Pattern and Target is erroneously intended to signify token-identity of feature structures that satisfy lexical entries.) Identity of tags within Pattern or Target, however, has its usual interpretation as an abbreviation of path equations or (in a language with variables) identity of variables.

15 The lexical entry (2a) matches the Pattern of (7) in that the expressions that the Pattern contains are contained in (2a), for 0 *≤ n ≤* 2. Taking *n* = 0, tag 1 stands for the expression (8a); tag 2 stands for the expression (8b), and tag 3 stands for the expression "*elist*".


The lexical entry (2b) is determined by the Target of (7) in conjunction with (2a) in that expression (8a) is the inher slash first value of (2b), and expression (8b) replaces expression (8c) just as the Target indicates. Thus, given (7), any Lexicon that contains (2a) must also contain (2b).


### 16 Complement extraction lexical rule and variable argument raising

not be contained in the lexical entry. Rather, lexical entry E matches Pattern P of lexical rule R if there is a consistent description D that contains the expressions of E and the expressions of P. Call the smallest such description D<sup>E</sup> . There must be a lexical entry E*′* that is determined by R's Target and D<sup>E</sup> . Take the Pattern of (7) with *n* = 1:

$$\begin{bmatrix} \text{(9)} & \begin{bmatrix} \text{0} \\ \text{ss} \begin{bmatrix} \text{Lock CART \text{REST } \text{REST}} \\ \text{RSTR} \end{bmatrix} \begin{bmatrix} \text{FIRST } \text{Lock} \\ \text{RSTR} \end{bmatrix} \end{bmatrix} \end{bmatrix}$$

The expressions in (9) are not contained in (4). But there is a description D(4) as in (10):

Hence, the Target of (7) determines lexical entry (11):

18 Two aspects of (11) are remarkable. First, the element in the slash value is not described as being identical to anything. This follows from the fact that the subcat rest first loc value in (10) is not – and cannot be – described as being identical to anything. Hence, the word *hat* in (12) might satisfy (11):

(12) \* wem [er es meiner Tante gegeben hat]

Second, consider the subcat rest value with tag 2 . The subcat value of the participle bears the same tag; hence (12) should be grammatical, and (3d) should be ungrammatical. (Cf. Hinrichs & Nakazawa 1994: 19 for a similar observation.)


20 However, the situation is not that simple. By lexically reducing the valence list, Pollard & Sag (1994: Ch. 9) has lost the account for binding reconstruction phenomena that comes for free with traces. To be able to keep the descriptive results, Pollard & Sag (1994) introduces a series of additional assumptions:

	- (b) The argstore value is unaffected by lexical rules reducing the valence value.
	- (c) But it is unknown how assumptions (a) and (b) can be expressed as a general fact in the grammar.
	- (iv) The CELR adds a slash to the *synsem* object in the argstore value whose loc value is put into the inher slash value.

### 16 Complement extraction lexical rule and variable argument raising

The lexical entries – in particular, (4) – and the OELR (7) have to be modified 22 accordingly.

$$\begin{aligned} \text{(13)} \quad \begin{bmatrix} \text{OLR, final version (similar to Problem & \textbf{Sag (1994: 378)):}}\\ \text{ass} \begin{bmatrix} \text{Tors car } \text{vBScar (nesx)}^{n} \end{bmatrix} \begin{bmatrix} \text{Fins } \boxed{} \text{Lloc } \boxed{} \boxed{} \\ \text{Riss } \text{T } \boxed{} \end{bmatrix} \end{bmatrix} \\ \begin{bmatrix} \text{NORC (niesx)}^{n} \text{Hism } \text{SLASH} \\ \text{AKSTORE (niesx)}^{m} \text{Fins } \boxed{} \end{bmatrix} \end{aligned} $$
 
$$\begin{bmatrix} \text{IOL } \text{Cart } \text{vBScar (nesx)}^{m} \text{ } \boxed{} \\ \text{Sos} \begin{bmatrix} \text{IOL } \text{Cart } \text{NHRS } \text{SLASH} \\ \text{Noss } \text{IOL } \boxed{} \boxed{} \\ \text{Konstr } \boxed{} \text{KST } \boxed{} \end{bmatrix} \end{bmatrix} $$
 
$$\begin{bmatrix} \text{IOL } \boxed{} \\ \text{ARGSTOR (nesx)}^{m} \text{ Finszt} \\ \text{sARGRN } \textbf{e} \end{bmatrix} \begin{bmatrix} \text{FisST } \boxed{} \\ \text{KST } \textbf{d} \end{bmatrix} \end{bmatrix} $$

(14) lexical entry of unslashed *hat* as in (3a), modified:

23 How does the D(14) look like for *n* = *m* = 1? Because of the problem noted in §20 (ii) (c), this cannot be known for sure. One benevolent speculation is (15):

In conjunction with (15), the Target of (13) apparently determines lexical entry (16):

### 16 Complement extraction lexical rule and variable argument raising

I wrote " 2 5 " for the value of :ss loc cat subcat rest in order to point to a problem. Upon both interpretations of tag pairs – as variables and as path equations – it seems unavoidable to assume that 2 = 5 . If that is correct, the subcat values of both the participle and the finite verb are cyclic lists. Hopefully, no feature structure will satisfy this lexical entry.

Assume alternatively that for some reason (15) does not contain the pair of 24 tags 5 . Then there is no cyclicity, but the subcat value of the finite verb has an element of just the form that is disallowed by the No Trace Principle (§6).

Apparently, the OELR requires the existence of realistically satisfiable slashed 25 lexical entries only in case some element is extracted that is explicitly mentioned in the valence value. For instance, in (3d) only *gegeben* can be slashed, but not *hat*. That is, Pollard & Sag's (1994) liberal matching conditions are of no consequence for the OELR.

This may seem like a nice result, since it solves the problem noted in §19. 26 But two problems remain. First, inasmuch as the result depends on the slashed member of the argstore value, it is suspicious, as Pollard & Sag's (1994) Subject Condition is known to be empirically problematic. There seem to be cases of parasitic gaps in subjects that are licensed by extraction out of an adjunct. Second, it appears that some empirical phenomena in German and in Romance languages cannot be described by slashing just the lowest verb.

The possible formal alternatives seem to be the following: 27


### **References**



### **Chapter 17**

## **Featuring creatures of darkness**

Tilman N. Höhle

"Pollard and Sag (1994: Chapter 5), pandering shamelessly to the GB masses, propose an analysis of English relative clauses that employs […] empty relativizers […]. […] The lexical entries for these creatures of darkness stipulate numerous ad hoc structure sharings. […] Their elimination would be a welcome result." Anonymous, spring 1994.

### Proposition: 1

(i) The essential characteristics of the First Null Relativizer(s) (§8) are empirically welcome.

(*pander to the N* 'dem (verwerflichen) N Vorschub leisten')


Warning. This talk is going to appeal to analytic intuitions in a very sketchy 2 manner. Many important details are not mentioned or/and left to future work.

<sup>∗</sup>Note: The empirical aspects of the topic are also displayed in a contribution to the Heinz Vater Festschrift (Sprache im Fokus, ed. by C. Dürscheid et al., Tübingen: Niemeyer 1997).

Tilman N. Höhle. 2019. Featuring creatures of darkness. In Stefan Müller, Marga Reis & Frank Richter (eds.), *Beiträge zur deutschen Grammatik. Gesammelte Schriften von Tilman N. Höhle. Second revised edition*, 553–569. Berlin: Language Science Press. DOI:10.5281/zenodo.2588379

<sup>§</sup> *Editors' note:* This is the previously unpublished paper version of a talk given at the IBM Wissenschaftszentrum in Heidelberg, September 7, 1994. It unifies two textual variants (of the same date) that show some minor differences. The citation style was adjusted to the conventions in this volume, and a few abbreviations in the original are systematically spelled out here (*Scandinavian* for *Scand.*, etc.).

### **1 English FNRs**

3 Pollard & Sag's FNR, nonraising (slash-binding) variety (cf. 1994: 216 (24)) (partial):

P&S's FNR, Subject-to-Subject Raising variety (cf. 1994: 218 (28)) (partial): 4

Comment 1. Ingeniously, P&S use the SELR to characterize (28) as being reg- 5 ularly expected on the basis of (24). I drop this assumption for empirical reasons (e.g., (13) below).

Comment 2. P&S specify 7 as "NP". I drop that as it is unjustified on both formal and empirical grounds.

The nonraising FNR (identical subscripts indicate token-identical referential 6 indices):


d. (minister*<sup>i</sup>* ) [[in the middle of whose*<sup>i</sup>* sermon] e*<sup>i</sup>* [<sup>S</sup> the dog barked t]]*<sup>i</sup>* (P&S (11d))

	- (4) a. (person*<sup>i</sup>* ) [who*<sup>i</sup>* e*<sup>i</sup>* [VP gave a book to Kim]]*<sup>i</sup>* (P&S (29))
		- b. (person*<sup>i</sup>* ) [[whose*<sup>i</sup>* sister] e*<sup>i</sup>* [VP gave a book to Kim]]*<sup>i</sup>* (P&S (3))
		- c. (person*<sup>i</sup>* ) [[pictures of whom*i*] e*<sup>i</sup>* [VP were on sale]]*<sup>i</sup>* (P&S (9))
		- d. ([… parties]*<sup>i</sup>* ) [[to be admitted to one of which*i*] e*<sup>i</sup>* [VP was a privilege]]*<sup>i</sup>* (P&S (23))

### **2 German non-3rd Null Relativizer**

	- (5) a. lieber dear Freund, friend den whom.masc [<sup>S</sup> wir we so so gerne gladly t besuchen] ! visit
		- b. dich, you.sg den whom.masc [<sup>S</sup> wir we so so gerne gladly t besuchen] visit
		- c. ich, I den whom.masc [<sup>S</sup> sie she so so gerne gladly t besucht] visits
		- d. Ihnen, you.honor den whom.masc [<sup>S</sup> wir we so so gerne gladly t besuchen] visit
	- (6) a. ? lieber dear Freund, friend der who.masc [uns us immer always so so gerne gladly besucht visited hat] ! has
		- b. dich, you der who.masc [uns us so so gerne gladly besucht] visits

17 Featuring creatures of darkness


But there is an unexpected alternative: 11

	- a *′* . lieber dear Freund, friend der who.masc [<sup>S</sup> du you uns us immer always so so gerne gladly besucht visited hast] ! have
	- b. dich, you der who.masc [<sup>S</sup> du you uns us so so gerne gladly besuchst] visit
	- c. ich, I der who.masc [<sup>S</sup> ich I sie her/them so so gerne gladly besuche] visit
	- d. Ihnen, you.honor der who.masc [<sup>S</sup> Sie you.honor uns us so so gerne gladly besuchen] visit

There is agreement between the antecedent and the subject of the relative clause 12 as to:

*c-inds* (speaker, hearer, number), honorification;

between the antecedent and the relative pronoun (just as in (5) and (6)) as to:

natural number, natural sex;

between the relative pronoun and the subject as to:

case (nominative).

No attempt is made here to develop precise agreement mechanisms and modify 13 the properties of the sorts *index* and *c-inds* accordingly. But it can be seen that the arrangement of constituents in (7) complies with the predictions of §8.


### **3 The attribute smor**

	- (9) a. [for [her to do the ugly work]] is pleasant for him b. \* [for [she to do the ugly work]] is pleasant for him
	- (10) a. azze that.1pl wy we de the törf peat niet not verkoopn sell kunt can.1pl (Haeringen 1958: 119) b. az(\*-ze) ze/zy de törf niet verkoopn kunt
		- that(-3pl) they the peat not sell can.3pl

17 Featuring creatures of darkness

And it helps accounting for VP topicalization with 'ergative' subjects in German: 17

	- b. [die the.nom.pl Argumente arguments ausgegangen] come.to.an.end sind/\*ist are/\*is uns for.us diesmal this.time nicht not

### **4 Scandinavian** *som*

In Scandinavian languages – in particular, in Norwegian – *som* functions as an 18 introduction (i) to expressions of comparison, (ii) to relative clauses, (iii) to *wh*interrogative clauses. (*That*-clauses are introduced by *at*, *whether*-clauses by *om*.)

### **4.1 Interrogative clauses**

There is no way to predict that *som* can occur with *wh*-interrogative clauses, and 19 it is unexpected that it is obligatory with subject interrogatives (12). With object interrogatives (13), it is possible but disprefered in Swedish and impossible in Norwegian.


A natural account is to postulate for Norwegian and Swedish (i) *om* as an inter- 20 rogativizer that is neither slash-binding nor raising, (ii) *som* as a raising irogvzr, (iii) a null slash-binding irogvzr; and for Swedish (iv) another *som* irogvzr that is slash-binding. Thus, the Swedish *som* irogvzrs overtly show just the essential properties of the English FNRs.

21 Scandinavian *om* interrogativizer (partial):

22 Scandinavian *som* raising irogvzr (partial):

23 There is a question as to how the propagation of the nonempty qe value is to be regulated. Since this involves general questions concerning the function and location of to-bind, these questions are not discussed here.

Swedish *som* slash-binding irogvzr (partial): 24

### **4.2 Relative clauses**

26 Relative clause introducing *som* is distributed just like the interrogativizer *som* is in Swedish, except that there is no (overt) relative phrase. Hence, there are two *som* rltvzrs and one null rltvzr that are all similar to the Second Null Relativizer of Pollard & Sag (1994: 222 (36)). Note that *som* in Scandinavian, as opposed to *that* in English, does not occur as an 'unmarked' complementizer, hence *som* in relative clauses cannot be treated like P&S attempt to treat *that* in their §5.2.3.


Scandinavian slash-binding *som* relativizer: 27

Scandinavian slash-binding null relativizer (just like §27): 29

### **5 English** *that***-relativizers**

English non-*wh*-relative clauses pattern exactly like the Scandinavian ones. Cf. 30 (23) and (24) to (18) and (19). Hence, I drop P&S's assumption that there is a nominative relative pronoun *that* (1994: 220 (33)). Instead, there are two *that*relativizers and one null relativizer corresponding exactly to the Scandinavian ones (§§27–29).


### **6 fV with and without 'subject inversion'**

	- (25) a. dat that jij you misschien perhaps ziek sick bent/\*ben are
		- b. jij you bent/\*ben are misschien perhaps ziek sick
		- c. (misschien) perhaps ben(\*-t) are jij you ziek sick

(Entjes 1970: 318)

	- c. (XP) kiiken wii

### 17 Featuring creatures of darkness

There is a broad spectrum of alternations throughout different dialects of Dutch.

It is apparent that S-fV and fV-S correspond to raising and nonraising comple- 35 mentizers such as seen in §22 and §§21, 24, respectively.

Raising S-fV *kiikt* (partial); cf. §22: 36

Nonraising fV-S (V1) *kiiken* (partial); cf. §§14 and 21: 37


### **7 Non-finite fV**

	- (29) a. dann then wollte wished ich I mir for.me eine a Stube flat mieten rent und and [verheiraten get.married.inf mich] myself (Teuchert 1921: 76)
		- b. moust must.you es once komen come en and [zain see ons our vooltje] foal (Veldman 1991: (101c))
		- c. ik I zoo should noo to hous home goon go en and [nemme(n) take.inf ze them mei] with (Bont 1962: 465)
	- (30) a. de the plysje police soe will bij to him him komme come en and [syn his papieren papers mei with nimme/\*nim] take

(Haan 1990: (8))


### **References**


Hudson, Richard. 1977. The power of morphological rules. *Lingua* 42. 73–89.


### **Chapter 18**

## **An architecture for phonology**

Tilman N. Höhle

### **1 Why and how**

"Phonology" is construed here in a broad sense. It comprises the system of unpredictable ("distinctive") phonological properties of expressions, which may be called phonemics, and the system of phonetic properties that are only predictable in terms of a language's phonemics in conjunction with phonetic rules specific to the language (but not by a theory of universal phonetics alone). It also includes "morphophonology," which deals specifically with phonological phenomena that are observed when signs are components of larger signs.

An explicit empirical theory that is to integrate a subject as large and diversified as phonology<sup>1</sup> needs to be built on a very clear but highly expressive formal basis grounded in a theory of language. The formal theory of language and grammar developed in King (1989) and work that builds on it, essential aspects of which also underlie the HPSG theory of PS94 (i.e., Pollard & Sag 1994), is exceptionally well suited for this task. Moreover, the structure of signs (i.e., objects of sort *sign*) proposed in PS94 is an excellent point of departure for a theory of morphology that is to be able to interact naturally with morphophonology.

<sup>1</sup> For information on phonology, useful recent reference works are available: for data and analytical ideas that have dominated discussions in (morpho-)phonology in the last decade(s), Kenstowicz (1994) and Goldsmith (1995b); and for phonetics, Ladefoged & Maddieson (1996) and Hardcastle & Laver (1997). Some information on formal phonology can be found in Bird (1995) and in Carson-Berndsen (1998).

Tilman N. Höhle. 2019. An architecture for phonology. In Stefan Müller, Marga Reis & Frank Richter (eds.), *Beiträge zur deutschen Grammatik. Gesammelte Schriften von Tilman N. Höhle. Second revised edition*, 571–607. Berlin: Language Science Press. DOI:10.5281/zenodo.2588381

<sup>§</sup> *Editors' note:* This paper was originally published in Borsley, Robert D. & Adam Przepiórkowski (eds.). 1999, *Slavic in Head-Driven Phrase Structure Grammar* (Studies in Constraint-Based Lexicalism), 61–90. Stanford, CA: CSLI Publications.

In the sections to come I will outline a frame of reference expressive enough to discuss empirical phenomena with a useful degree of explicitness, resulting in a simple architecture for phonology in the broad sense (summarized in §8). Some aspects of the architecture (and questions waiting to be explored) are illustrated with examples from Russian, German and Miwok. No originality is claimed in either respect. My intention, on the contrary, is to remind ourselves that a framework in which to do formal phonology, closely related to PS94, is at hand (even though the multistratality that I endorse here has routinely been rejected). I further believe that considerations from phonology can contribute to the efforts (e.g., in King 1999 and Pollard 1999) to explicate the meaning of grammars, and that the particular model-theoretic conceptions adopted here can in turn contribute to attempts to elucidate the relation between the grammar and physics of phonetics.

### **2 Segments and segmental strings**

### **2.1 Signature**

As in PS94, signs bear an attribute phon(ology). Its value is of sort *phon*. The structure of *phon* objects is described in Figure 1.

Figure 1: Structure of *phon* objects

The s(egmental)-string value is a (possibly empty) list of segments, whose internal structure will be considered below. The string of segments is hierarchically ("prosodically") structured, minimally into syllables, feet and phonological words.

Although phonological words will play an important role in §7, the hierarchical structure shown in Figure 1 is provisional. Intuitively, one might expect that a phonological word is constituted by a sequence of feet, a foot is constituted by a sequence of syllables, and the s-string (i.e., the s-string value) is exhaustively syllabified. Then, the phonwords value should be a list of *phonword* (rather than

### 18 An architecture for phonology

*nelofsegment*) objects, and the attributes syllables and feet would be born by *foot* and *phonword* objects, respectively. But phenomena of extrasyllabicity (cf., e.g., Bagemihl 1991, Gussmann 1992, Hyman 1992) and extrametricality, as well as the mismatch of syllables and phonological words in (25) below, indicate that the relations between s-strings, syllables, feet, and phonological words can be far less simple. Thus, although it is obvious how members of syllables, feet, and phonwords values can formally be related to s-string members (cf. Mastroianni 1993 for syllables), there is a host of empirical questions that I will not enter into.

The structure of segments is determined by the inventory of non-atomic sorts and their feature declarations in (1) on the following page. Indentation indicates partitioning into subsorts; thus, e.g., *vowel* and *consonant* partition *segmproper*; *obstruent* and *sonorant* partition *consonant*; *fricative*, *affricate* and *plosive* partition *obstruent*; *nasalcon* and *liquid* partition *sonorant*; *lateral* and *rhotictrill* partition *liquid*. For *segmproper*, the attributes airstream, voicing, velum and tongue are appropriate; for *consonant*, constriction is appropriate. Attributes appropriate for a sort are also appropriate for that sort's subsorts. Atomic sorts, for which no attribute is appropriate, are partitioned in (2).

(2) *achievement*: *full, reduced, zero*. *airstream*: *pulmonic, ejective, implosive, click*. *lateralclosure*: *sideslocked, sidesunlocked*. *listofplace*: *elist, nelofplace*. *narrowing*: *round, nonround*. *sideslocked*: *grooved, nongrooved*. *sitecor*: *upperlip, dental, alveolar, postalveolar, palatal*. *sitedors*: *velar, uvular*. *sitelab*: *upperlip, upperteeth*. *velum*: *openvelum, closedvelum*. *vertical*: *high, mid, low*.

List supersorts, such as *listofsegment* in Figure 1, are always partitioned analogously to *listofplace*. Construing a string of segments as a list of tree-like objects with some trees sharing some branches, as illustrated in Figure 2 below, is a straight explication of notions that can be found, e.g., in Clements (1985: 237); a difference being that Figure 1 (just like Scobbie 1997) does not provide for "autosegmental tiers" independently of the segmental string. In detail, there has been (and will continue to be) much discussion on the proper structure of segments; cf., e.g., Bird (1995: Chapter 4), Clements & Hume (1995), and Ladefoged (1997) for three different proposals. I cannot hope to discuss here all aspects of (1), (2). Certain aspects will be commented upon below.


18 An architecture for phonology

### **2.2 "Underspecification" vs. total well-typedness**

I adopt HPSG's standard assumption that the objects in a model of a grammar are "totally well-typed,"<sup>2</sup> hence each object bears all attributes that are appropriate for its sort (cf. PS94, 396). Although this assumption has first been explicitly introduced in King (1989), it is less than self-evident with respect to this theory's intended models. There are no obvious formal or ontological reasons for insisting on it. Dropping it would remove a "foundational problem" in PS94's theory of coordination (PS94, 203, note 39) and would be conducive to an attempt to formally reconstruct theories of phonemic "underspecification" that have loomed large in the eighties.

For an illustration, we may consider some data from §7. Slavic languages are known for a regressive voicing assimilation that affects obstruents at the end of words. In Russian, the assimilation is only triggered by obstruents, in which voicing is (mostly) distinctive, but not by vowels and sonorants, in which voicing is predictable. To capture the dependence of assimilation on distinctive voicing, Kiparsky (1985) and others suggest that phonemically, vowels and sonorants do not have any voicing properties (i.e., they do not bear a voicing attribute), so that the assimilation is phonemically triggered just by segments that do have voicing properties.

Of course, *vowel* and *sonorant* objects that lack voicing properties cannot surface as such; they must map to corresponding objects that bear a voicing attribute. We thus get configurations as schematically described in (3) for vowels:

<sup>2</sup> In the formal theory that I rely on (King 1989; cf. also King 1994 and note 16 below), a grammar G consists of a signature (such as PS94, 396–399) and a set of restrictions ("constraints/ principles/rules," such as PS94, 399ff.), each of which is an expression of a formal description language. The description language of King (1989) has disjunction, classical negation, sort specifications, and path equations. Let U be a set that conforms to the signature in that the denotations of the maximally specific sort symbols partition U, and each attribute symbol denotes a partial function from U to U, respecting appropriateness. With total well-typedness, the function is total with respect to the denotations of the sorts that the attribute is declared to be appropriate for. There is a denotation function *D* from the set of description language expressions to the powerset of U. Thus, a description language expression denotes a subset of U. It can require (by a path equation) that on each member of its denotation, certain path values are token identical, but it cannot identify any particular member of U. U is a "model" of G just in case U = *∩{D*(*δ*) *| δ ∈* Restrictions*}*. Crucially, the relation of a grammar's models to a natural language is as lucid as it can possibly be: the members of the intended models are token linguistic objects. Specifically, for a grammar G, some natural language L is intended to be an exhaustive (i.e., maximally inclusive) model of G (King 1995; 1999).

$$\begin{array}{ll} \text{(3)} & \text{a.} & \left[\begin{bmatrix} \sigma\_{2} \\ \varphi \,\,\pi\_{1} \begin{bmatrix} \texttt{ronNGUE} \,\boxed{\Box} \\ \texttt{voicING} \,\,\mathit{voiceed} \end{bmatrix} \right] \\ & \pi\_{2} \left[\begin{smallmatrix} \texttt{pHON} \,\pi\_{3} \begin{bmatrix} \sigma\_{1} \\ \texttt{ronNGUE} \,\boxed{\Box} \end{bmatrix} \end{smallmatrix} \right] \end{array} \right] \\ & \mathbf{b.} & \neg \left[\pi\_{2} \left[\begin{smallmatrix} \texttt{pHON} \,\pi\_{3} \left[\begin{smallmatrix} \texttt{voicING} \,\prescript{}{}{\mathit{voicING}} \end{smallmatrix} \end{smallmatrix} \right] \right] \end{array}$$

The symbols *σ*<sup>1</sup> and *σ*<sup>2</sup> are meant to be variables over maximally specific subsorts of *vowel*; *φ* is a cover symbol for some phonological attribute (such as phon or utterance, introduced below in (7)); the *π<sup>i</sup>* are path variables. The descriptions in (3a) and (3b) are to be understood conjunctively: objects that satisfy (3a) also satisfy the negative description (3b). Thus, the *π*<sup>3</sup> value does not bear a voicing attribute. Even if the attribute values of the *π*<sup>3</sup> value are identical to attribute values of the *π*<sup>1</sup> value, as shown for tongue, the *π*<sup>1</sup> value cannot be identical to the *π*<sup>3</sup> value, as only the former bears a voicing attribute.

When total well-typedness is dropped, *σ*<sup>1</sup> and *σ*<sup>2</sup> can be identical; while with total well-typedness retained, they cannot. Sort identity probably conforms to the intuitions underlying underspecificational analyses better than nonidentity.

In southwestern variants of Polish, the word-final voicing assimilation is also triggered by vowels and sonorants; i.e., distinctiveness of voicing is not relevant there. This sheds doubt on the attempt to account for the situation in Russian by an ontological construct like underspecification.<sup>3</sup> For broader critical discussion, cf. Broe (1993: Chapter 9), Goldsmith (1995a), Calabrese (1995: §6), Zoll (1997: 370), and references therein.

On inspection, then, the supposed empirical virtues of allowing objects not to bear attributes they are allowed to bear typically turn out to be deceptive. Moreover, segments that cannot surface in principle would contradict what I regard as an important leading conjecture: all segments are physically interpretable. Physically uninterpretable segments should be admitted in the linguistic ontology only in the face of unequivocal positive evidence. No such evidence is known.

Independently of these empirical considerations, experience indicates that working with a fully explicit theory that forgoes total well-typedness gets unwieldy to an extent that outweighs any doubt about its being ontologically wellmotivated. I thus see no reason to drop, but strong reasons to retain, total welltypedness.

<sup>3</sup>Historically, "underspecification" has more often been motivated by considerations of markedness. This motivation has been obsolete at least since Kean (1981) and Höhle (1982).

### 18 An architecture for phonology

### **2.3 Some comments on the signature**

According to (1), then, each *segmproper* object bears an attribute tongue whose value bears attributes indicating the horizontal and vertical tongue positions that characterize vowel gestures. I follow Odden (1994) in classing the narrowing of the frontal oral tract associated with "rounding" in vowels together with the horizontal specification.

Consonants in addition bear an attribute constr(iction) whose value indicates one or more places of consonantal constriction. Thus, the constr value is a list that is treated in such a way that the order of list members is immaterial. In this way, double articulation of stops and nasals – which may be phonemic or may result from contextually induced coarticulation – can be captured.

At the same time, consonants bear the tongue specifications that characterize vowels. This captures the fact that vowel gestures typically "act as a kind of background to the "figure" of the consonants" (Browman & Goldstein 1990: 354). It is exploited phonemically in languages that have distinctive secondary articulations, such as palatalization, velarization or labialization.

Tense vowels often differ from lax vowels by being articulated with the tongue root advanced. This is not necessarily true of low vowels, though. A more general (if more complex) characterization might be centralization in lax vowels. In consonants, the *tongue* subsort typically has no perceptually appreciable consequence. But in some languages, tongue values of sort *tense* and *lax* cooccur with a battery of different articulatory properties in consonants, cf. Local & Lodge (1996). Thus, the phonetic correlates of the subsorts of *tongue* are not fully universal and are in any case somewhat indirect.

Major class and manner distinctions (vowel vs. consonant, sonorant vs. obstruent, etc.) are captured in (1) by subsorts of *segmproper*. (Inclusion of *affricate* among the manner sorts is meant to be hypothetical; it raises questions that I cannot discuss here.) Non-atomic sorts can thus contribute to phonetic characteristics just like atomic sorts.

Considering the attribute achievement that is born by *place* objects, there is evidence (mainly from stops) that the degree of constriction that is characteristic of consonants can be reduced under the control of the speaker, often leading to the perception of assimilation or loss; see, e.g., Nolan (1992), Barry (1991), Jun (1996). This can be captured by the achievement value. While values of sort *full* and *reduced* should be unproblematic, the value sort *zero* points to an important topic of research.

Nolan (1992) classifies as "zero" consonant productions where no closure is measured (by the method used). Correspondingly, hearers under ordinary con-

ditions typically do not perceive a closure in cases like this. The main difference with mere absence of closure lies in the fact that under favourable conditions, hearers do perceive a closure with more than chance frequency. Also, zero productions are typically found in free variation with reduced productions, which is natural if zero is understood as extreme reduction. Still, it is obvious that this concept is empirically difficult, and experiments need to be replicated under the most careful control of all potentially relevant factors. But I take it that at least some studies have made it plausible that zero closure, as distinct from absence of closure, is real.

In fricatives, reduced and zero achievements correspond to "approximant" and vowel-like degrees of constriction, respectively. A case in point might be the rhotic in Standard German, which is a fricative (or approximant) when in a syllable onset, as in [ti:.K@] *Tiere* 'animals', but vowel-like in a coda, as in [ti:2] *Tier* 'animal'. (Final obstruent devoicing is only observed with unreduced constrictions.)

Somewhat speculatively, I assume that the achievement attribute is also appropriate for *voicing* objects. Its phonetic meaning differs slightly for *voiced* and *voiceless* objects. I follow Goldstein & Browman (1986) (and Ladefoged & Maddieson 1996: 49ff.) in considering the state of the glottis to be the primary characteristic of systematically voiced vs. voiceless segments: in "voiced" segments, the vocal folds are adducted, which is just their neutral state in the speech mode; in "voiceless" segments of sort *spreadgl*, they are actively abducted. For there to be voice, transglottal pressure must in addition be kept sufficiently high. The achievement value relates to the active gesture.

In a *voiced* object, a value of sort *reduced* or *zero* means that transglottal pressure is reduced. Thus, unvoiced word-initial plosives as in Standard German [d ˚ u:] *du* 'thou' can be analysed as having a voicing value of sort *voiced* that has an achievement value of sort *zero*, perceptually almost indistinguishable from the unaspirated [tu:] *tu* 'do' of Austrian German, which has a voicing value of sort *spreadgl*. (Cf. Flege 1982 for English.)

In a *spreadgl* object, an achievement value of a sort other than *full* means that the vocal folds are less than optimally abducted; in a *closedgl* object, it means that the vocal folds are not fully closed. If at the same time transglottal airflow happens to be large enough, sufficient transglottal pressure may build up to cause voice to be perceived.

### **2.4 On token (non-)identities**

By using subsorts of *segment* to distinguish long from short segments, I try to forestall any temptation to view slots in a list of segments (i.e., individual *nelof-*

### 18 An architecture for phonology

*segment* objects) as time units. A physically interpreted list of segments can be viewed to be a "timing tier" in two respects. First, the articulatory gestures that correspond to gesturally relevant components<sup>4</sup> of a segment overlap temporally. A segment thus corresponds to a constellation of gestures during a temporal interval. Second, the sequence of segments in the list corresponds to a temporal sequence of constellations of gestures. But the duration of temporal intervals corresponding to segments in a given list varies drastically in accordance with their position in syllables and other factors; cf., e.g., Smith (1991; 1995), and Browman & Goldstein (1988). Thus, there is no unit of time that could consistently be associated to slots in a given list. But consistent association is presupposed when a segment is explained to be long just in case it occupies two adjacent slots, as is usually done in "skeletal" theories. Otherwise this explanation is just a marking device for phonological length as phonetically arbitrary as any other.

The main phonological motivation for the double-slot analysis is the fact that phonotactically, long vowels often pattern with diphthongs and long consonants, with consonant clusters. Closer inspection, however, suggests that these phonotactical facts are more adequately captured by syllable theory in conjunction with a theory of phonological weight. (But I take the theory of weight to be a research topic rather than a fully developed theory; cf. Kenstowicz 1994: §8.4, Perlmutter 1995, and Hume et al. 1997 for overviews and discussion.)

I adopt a reformulated version of the "Sharing Constraint" in Scobbie (1997: 93, (3.13)):

(4) In a list of segments *⟨s*1*, . . . , sn⟩*, if a component *o* of *s*<sup>1</sup> that corresponds to an articulatory gesture is also a component of *s<sup>j</sup>* , then *o* is also a component of every *s<sup>i</sup>* with 1 *< i < j*.

If one token gesture is overlapped by two constellations of overlapping gestures, it is overlapped by each such constellation in between.<sup>5</sup> Thus, (4) is necessarily true for physically interpreted lists of segments (utterance s-string values; cf. §4). I require not only all segments, but also all lists of segments to be physically interpretable, hence it must be true for all such lists. Thus, (4) is just a natural consequence of any empirically clear explication of autosegmental phonology, such as found, e.g., in Sagey (1988).

As both Sagey (1988) and Scobbie (1997) note, (4) is inconsistent with many uses the "Obligatory Contour Principle" and "autosegmental spreading" in nonconcatenative morphology have been put to. The obvious conclusion, drawn in

<sup>4</sup>An object *o* is a "component" of an object *o'* just in case *o* is the value of a path on *o'*. (The path can be empty.)

<sup>5</sup> I assume physical events to be temporally connected by necessity. This assumption is rejected in Bird & Klein (1990: 41) and Bird (1995: 73).

both Sagey (1988: 115f.) and Scobbie (1997: 223ff.), is that "long distance" identities are not token but type identities.<sup>6</sup> One can expect to see direct evidence for type (vs. token) identity in particular with consonants, e.g., in reduplication and in Semitic biradicals. It is indeed well-known that long distance geminates are not true geminates at all. Cf. Scobbie (1997: Chapter 6), and Gafos (1998) for discussion of these and related facts.

One particularly important sort of long distance identity is found in vowel harmony. Formally, the geometry of (1) allows a tongue value component to extend over an unrestricted number of segments, and this seems indeed to be the case with lip rounding in the rounding harmony of Turkish vowels (Boyce 1990). But for several languages, there is evidence that, e.g., in a sequence such as [ipi], there are typically two tokens of the vowel gesture, rather than one token extending over the whole string (Gay 1981: 137, Bell-Berti & Harris 1981: 12, McAllister & Engstrand 1991), and there is no evidence that vowel harmony languages necessarily disobey this pattern. Rather, there is acoustic evidence that some obey it (Bessell 1998). Moreover, vowel harmony systems often include "transparent" vowels that allow harmony to operate across them even though they fail to have the harmonically relevant phonetic property. Thus, Scobbie (1997: 223) is clearly correct in assuming that vowel harmony deals essentially with identities of types rather than tokens.

### **2.5 Phonemic sorts**

I posit phonemic sorts (similar to those in Mastroianni 1993) as partitionings of major class and manner sorts; individual languages may differ (to some extent) in their inventory of phonemic sorts. As an illustration, some (incomplete) partitionings for German are introduced in (5), with some of the attending restrictions given in (6). ('first' and 'rest' are abbreviated ft, rt; other abbreviations are transparent.)

(5) *vowel*: *sort*\_i, *sort*\_I, *sort*\_u, *sort*\_ʊ, *sort*\_y, *sort*\_ʏ, … *plosive*: *sort*\_k, *sort*\_g, *sort*\_t, *sort*\_d, *sort*\_p, *sort*\_b. *nasalcon*: *sort*\_n, *sort*\_m, *sort*\_ŋ.

<sup>6</sup>Two objects are "type identical" if they have some significant property in common. An important case of type identity can be enforced by "sort equations": a description language expression of the form *τ*<sup>1</sup> *≃ τ*<sup>2</sup> denotes the subset of U such that on each member, paths *τ*<sup>1</sup> and *τ*<sup>2</sup> are defined and the values of the paths are of the same maximally specific sort. (See §6 for an example.)

Figure 2: Phonemic structure of [kʏnd]

$$\begin{aligned} \text{(6)} \quad &\text{sort\\_i} \rightarrow \text{TONGUE} \begin{bmatrix} \text{tense} \\ \text{VRETAL\\_high} \\ \text{HORIZ} \begin{bmatrix} \text{front} \\ \text{NARRW\\_nonround} \end{bmatrix} \end{bmatrix} \end{aligned} $$

$$\begin{aligned} \text{sort\\_y} \rightarrow \text{TONGUE} \begin{bmatrix} \text{lax} \\ \text{VRETAL\\_high} \\ \text{HORIZ} \begin{bmatrix} \text{front} \\ \text{NARROW\\_round} \end{bmatrix} \end{bmatrix} \end{aligned} $$

$$\begin{aligned} \text{sort\\_k} \rightarrow \begin{bmatrix} \text{vorecings\\_wiedless} \\ \text{consstr\\_r} \text{rtsrc\\_velar} \end{bmatrix} \\ \text{sort\\_d} \rightarrow \begin{bmatrix} \text{voorings\\_wieder} \\ \text{consrs\\_r} \text{r\\_srrs\\_alveal} \end{bmatrix} \end{aligned} $$

*sort*\_n *→* constr ft site *alveolar*

Sorts like these do not only serve to keep descriptions more compact, but play a useful role in enforcing type identities and in determining which components of segments are (not) free to subphonemic variation.<sup>7</sup>

A conceivable description of the initial four members of an s-string value for German [kYndIg@] *kündige* 'terminate' is given in Figure 2. (I assume that in this configuration the tongue gestures of the vowels overlap the adjacent consonants and that with voiced obstruents a voicing gesture typically sets in.)

### **3 Phonetic strings**

Phonetic strings may exhibit segmental phenomena that are not naturally captured by s-strings. A possible case in point are "transitional" segments. For instance, corresponding to the substring [Yn] as described in Figure 2 there probably is a phonetic string where the velic opening gesture sets in before the alveolar constriction gesture does; this might be described as in Figure 3.

<sup>7</sup> In consonants whose constriction value has more than one member, the role of phonemic sorts is formally nontrivial. The order of list members being immaterial, a voiced plosive with constr value *⟨dorsal, labial⟩* can be of *sort*\_b or of *sort*\_g. In a language that has a phonemic double articulation sort such as *sort*\_gb, a segment with the same constr value could also be of that sort.

There may be further roles for phonemic sorts. Some speakers of Standard German progressively assimilate syllabic alveolar nasals to uvular [K]: they have [ti:.Kð] next to [ti:.Kn] *Tieren* (dat. pl.). What sort should the uvular nasal belong to? There are several possible responses, one of them being that *sort*\_n objects are not unconditionally required to be alveolar, as they are in (6), but only when they are in an environment that does not induce assimilation.

18 An architecture for phonology

Figure 3: Transitional segment in [ʏʏ̃n]

As noted earlier, segments correspond to time intervals (of varying durations) of overlapping articulatory gestures. In this respect, transitional segments as in Figure 3 are no different from phonemic segments as in Figure 2. More particularly, in Figure 2 the alveolar closure of [nd] and the tongue characteristics of [kYn] are both partially overlapped by the velar opening of [n]. The only new aspect in Figure 3 is the lack of alveolar closure in [˜Y]. There is thus no reason to exclude transitional segments from the universe of linguistic objects in principle.<sup>8</sup>

I assume that transitional segments do not "feed" morphophonological phenomena. It thus should be sufficient to associate strings as in Figure 3 with signs that are not embedded in another sign. Unembedded signs, which can be performed as (complete) utterances, need to be distinguished by a special sort for quite independent syntactic, semantic and pragmatic (e.g., illocutionary force) reasons. Adapting a proposal in Richter (1997: 134ff.), I partition the sort *phrase* and require unembedded phrases to bear a distinguished phonological attribute whose value hosts a non-empty list of segments:

(7) *phrase* … *embedded-phrase unembedded-phrase* utterance *phon*

(8) *unembedded-phrase →* utterance s-string *nelofsegment*

For ease of expression, I reserve the term 's-string' to phon s-string values and call an utterance s-string value a "p-string." Figure 3 can now be understood

<sup>8</sup>On the face of it, transitional segments such as [˜Y] can be avoided by allowing values of paths on segments to be lists whose order of members is temporally interpreted. Thus, [Y˜Y] would be one segment with a velum value *⟨closedvelum, openvelum⟩*. I prefer to eschew "contour" values like that, though: they complicate matters in that they, in effect, introduce something like segments within segments, yet do not, as far as I see, solve any problem that transitional segments might be attended with.

as (an informal rendering of) a description language expression that denotes (a set of) components of some p-strings.

In simple cases, a phrase's p-string may be identical to its s-string. In cases where transitional segments are to be components of signs, the p-string is related to the s-string in the way suggested by the relation of [Y˜Yn] to [Yn]. In general, though, the relation is not necessarily that simple. For German [OK.dn@] *ordne* 'put in order', many speakers have an alternate pronunciation [OK.n@]. The plosive [d] cannot be overlapped by a lowered velum gesture, according to (1), hence it cannot appear as a member of the p-string in the latter case. The same is often observed with syllabic nasals, as in [le:.N] next to [le:.gN] *legen* 'lay'. Similarly, [b@.am.tn] *Beamten* 'officials' has an alternate pronunciation [b@.am.pm], discussed in Kohler (1992), where the alveolar constriction of [tn] is not just overlapped, but in fact replaced, by the bilabial constriction from [m]. If these variations are to be accounted for by the relation of p-strings to s-strings, as seems reasonable, the relation cannot in general preserve segments or even phonemic sorts.

### **4 Physical interpretation**

Intuitively, in a token *unembedded-phrase* object, components of its p-string are intended to correspond to (possible) physical events. As an explication, I propose there is a total bijective function Φ from the set of p-strings of language L to the set of u-equivalences of L, where the latter partitions the set of possible utterance events of L. To explain this, I temporarily suppose that a u-equivalence is just a singleton set. Thus, each p-string (a maximal *nelofsegment* object) is mapped to a complete utterance event (the member of a u-equivalence) such that each component of a gestural sort (e.g., *voicing*, *velum*, *place*, *lateralclosure*) is mapped to an articulatory gesture and each *segment* component, to a constellation of such gestures during a section of the utterance.

More exactly, for a given (token) p-string, I take there to be a choice among possible utterance events that differ along continuous dimensions that are considered to be "stylistic," i.e., linguistically irrelevant: loudness, pitch level, speaking rate, etc. Thus, a u-equivalence actually is a maximal set of stylistically alternative possible utterance events; it clearly is non-denumerable.

We need to have Φ in order to give an accurate empirical explication to our phonological notions. The apparatus sketched in the previous sections is unable to characterize well-known properties of gestures adequately. Velar closure events, e.g., differ considerably (in many languages) in accordance with adjacent

### 18 An architecture for phonology

(front or back) vowel gesture events; conversely, low vowel gesture events that overlap an alveolar constriction event are very different from the gesture events for the same vowel without alveolar overlap. That is, the notion of "gesture" that we have relied on is a highly abstract one; the precise properties of individual gesture events cannot be explicated without a detailed theory of the coarticulatory interaction of different gestures.

Any such theory must take seriously the fact that gestures are constituted by actions of spatiotemporal physical entities ("articulators" and air volumes) that change their location over time. To be adequate, such a theory – however abstract it might be – must have unrestricted recourse to the relevant physical theories and their attendant mathematical apparatus. For brevity, I call such a theory a "physical" theory.

One physical theory of that kind is known as "task dynamics." Cf. Saltzman (1995) for a general exposition, and Saltzman & Munhall (1989) for a detailed one; also McGowan & Saltzman (1995) for an extension. Adapting it to the present frame of reference (and simplifying somewhat), we can say that the physical theory defines a mapping from p-strings and their component objects to maximal sets of stylistically alternative possible physical events in accordance with an object's gestural properties and the influences of contemporaneous and immediately preceding physical events.<sup>9</sup>

I do not take models of grammars to include physical events. Rather, phonological linguistic objects are as abstract as any other linguistic object, and (sets of alternative) possible events constitute the interpretation (in the model-theoretic sense) of the relevant linguistic objects, with a physical theory defining the interpretation function, i.e., Φ.<sup>10</sup>

As we have seen in the previous section, and will see again later on, a component of an s-string is not necessarily also a component of a p-string. Although I consider it important that each (list of) segment(s) be physically interpretable in principle (cf. (4) above), there is no reason to insist that each of them is actually interpreted. The natural assumption is that with respect to the set of *nelofsegment* objects, Φ is partial in that it is only p-strings that are in its domain.

There are good reasons (in particular, from acoustically hidden articulatory

<sup>9</sup>To capture the role of syllable structure and stress for the temporal duration and phasing of gestures, the physical theory must access the full utterance value.

<sup>10</sup>I thus concur with Sagey (1988), Pierrehumbert (1990), Coleman (1998) and others that the relation of phonological linguistic objects to physical events is "semantic" in nature. I will not explore here the ontologically more parsimonious hypothesis that those objects are physical events themselves, so that some Φ*′* maps events as structured by sorts and attributes to the same events as structured by a physical theory.

gestures; cf., e.g., Browman & Goldstein 1990: 363ff.) to require (sets of alternative) articulatory events to be in the range of Φ. But in principle, the range might also include certain kinds of acoustic events (e.g., for vowels) that are only secondarily related to articulatory events, as argued for in Ladefoged (1990) and Perkell et al. (1995).

It seems clear that the defining characteristics of Φ can in large part be universal. The assumption that there is a strictly universal core to them is in fact a conceptual necessity if (at least major aspects of) (1) and (2) are to have the empirical import they are intended to have. But it seems equally clear that they are not fully universal. Thus, fine details of gestures in different languages just escape the categorial distinctions that can be adequately captured by sorts of linguistic objects (cf. Ladefoged 1980). Some details of Φ's characteristics apparently have to be learned for individual languages; but the learning theory for these details may be conceived to be quite weak.

According to Solé (1995), Spanish shows in vowels before nasal consonants significant anticipatory nasalization which is durationally constant across varying vowel durations in differing speaking rates. In American English, by contrast, anticipatory nasalization sets in at the beginning of the vowel (at the end of a preceding consonant), regardless of the vowel's duration. Solé (1995) suggests that the nasalization in English is "phonological," whereas in Spanish it is an "automatic phonetic" phenomenon.

We can reconstruct this intuition by assuming that in English, there is one fully nasal *vowel* object in the p-string, whereas in Spanish, there is no nasal vowel in it, not even a transitional one as in Figure 3. Rather, a transitional nasal vowel event is predicted by Φ. This is formally possible since the mapping from lists of segments to events may be less than trivially transparent. It is also compatible in principle with the fact that some languages otherwise similar to Spanish differ in details of nasalization (cf. Clumeck 1976), since we recognize that parts of Φ's characteristics can be learned.

This construal appears plausible. In English, the onset of velic lowering seems to be phased with respect to the offset of a consonant gesture preceding the vowel, and there does not seem to be a natural alternative way to express this. In Spanish, the constant phasing of the onset of velic lowering with respect to the onset of the nasal consonant gesture is in fact what we might expect of gestures that are coupled by a sort (subsort of *nasalcon*). Still, the present state of theorizing about Φ does not warrant the conjecture that transitional segments as hypothetically illustrated in Figure 3 are universally non-existent. (Cf., e.g., Mohanan 1986: 164 for a candidate example.)

### 18 An architecture for phonology

According to Cohn (1993), the velocity of velic opening (or closing, in persevering nasalization) in predictably nasalized vowels adjacent to nasal consonants is (under most circumstances) much slower in English than it is in Sundanese. Although Cohn (1993) interprets this as a difference between "phonetics" and "phonology," it simply seems that in English, there is one (long, and hence, slow11) velic opening/closing gesture extending through the consonant and the vowel, whereas in Sundanese, there is a sequence of two (overlapping) velic gestures for the consonant and the vowel. If correct, this means that in Sundanese, but not in English, there are two different *openvelum* objects in adjacent p-string members. There are thus many more instances of type (vs. token) identities in strings of segments than assumed in much recent work. Cf. Saltzman & Munhall (1989: 362–365) for related considerations on phasing relations.

Just as with transitional segments, the question arises whether the work of achievement values can and should be done by the definition of Φ. Two considerations might support this alternative. Reductions do not seem to play a role in phonemics;<sup>12</sup> this would follow from them not being accessible in s-string members. And when a *place* (or *voicing*) component of an s-string fails to be a component of the p-string, the achievement value of that component may in many cases be spuriously ambiguous. On the other hand, languages are known to differ in the conditions and the extent to which reductions are used (cf. Jun 1996). Relegating them to Φ thus locates further aspects of linguistic knowledge outside the grammar and presupposes a rather strong learning theory for Φ's characteristics.

How the grammar of phonetics and the theory defining Φ interact is a large topic of research that can only proceed by working out detailed theories of both. The presence of the utterance and achievement attributes is thought to be conducive to this enterprise.

### **5 Morphology: Four basic issues**

For morphophonology, PS94's notion of signs is highly attractive in that both simple and complex signs bear a phonology attribute. This fact by itself provides the multistratality needed to account for "postlexical" phonological phenomena

<sup>11</sup>In long consonants, the closing movement is much slower than in short consonants (Smith 1995: 217ff.). This accords well with the assumption in Kröger (1993: 222) that articulator velocity is a function of the gesture's duration and amplitude.

<sup>12</sup>However, approximants and fricatives are reported to contrast phonemically in some languages (Ladefoged & Maddieson 1996: 76 and 324).

(e.g., sandhi). This notion, moreover, generalizes naturally to morphology such that words are built from smaller signs which, by bearing their own phonology attributes, provide the strata that I hypothesize are necessary and sufficient to account for word-internal phonological alternations.<sup>13</sup> (See also Orgun (1996) for a vivid defense of the same view.)

Although many aspects of morphological theory can be left open for the purpose of morphophonology, four basic topics need to be commented upon: (i) lexical licensing, (ii) combinatorial properties of morphemes, (iii) phonological effects of morphological combining, (iv) the triggering of the phonological effects.

In natural languages the smallest signs are conventionalized tuples of (at least) semantic, phonological, morphosyntactic and combinatorial properties. To be able to account for the tuples being conventionalized (rather than for any formal reason), PS94, like most grammatical theories, requires the smallest signs in a model (in PS94: words, i.e., objects of sort *word*) to be "licensed" by "lexical entries." Although PS94 does not indicate how licensing is to be formally achieved, one obvious way (taken, e.g., in Pollard 1993) is to include a "Word Principle" of the form (9) among the restrictions of the grammar:

$$\text{(9)}\quadword \rightarrow \left(\text{le}\_1 \lor \dots \lor \text{le}\_n\right)$$

Thus, each word must satisfy one of *n-*many lexical entries le*<sup>i</sup>* , each of which is a description language expression that denotes the set of objects that are "licensed" by that entry. The set of disjuncts in the consequent of (9), then, constitutes a "lexicon."

In a language with productive derivational morphology or/and compounding, the set of disjuncts in (9) would typically have to be infinite, which is impossible by the definition of the description language. The natural response (given, e.g., in Krieger & Nerbonne 1993) is to recognize formally that words can have smaller signs as components, and modify (9) accordingly.

Empirically, larger signs can also be conventionalized in that their properties do not fully derive from the properties of their component parts by general rule. This is sometimes seen in phrases, and often in complex words. To deal with cases like these, we would need to have a general formal theory of idioms. Although the theory of collocations sketched in Richter & Sailer (1999: §4) appears to be a promising basis to build such a theory on, I ignore these cases for the time being.

As for the second topic, minimal signs (morphemes) differ in their combinatorial properties just as words differ in theirs, except that the selectional mech-

<sup>13</sup>The way morphology and phonology interact here can be viewed as a straight explication of a core idea of "Lexical Phonology," e.g., in Mohanan (1986: 142f.)

### 18 An architecture for phonology

anisms for morphemes are considerably more powerful than those for words. Although there is no shortage of empirical research (e.g., Fabb 1988, Stonham 1994, and references therein), there does not appear to be a (successful) general formally explicit theory of selection.

Our primary interest is in the phonological effects on a parent of the combination of morphological daughters, i.e., the morphophonology. The simplest cases of concatenative morphology are similar to phrasal segmental phonology in that just the order in the parent of the daughters' concatenated s-string values must be specified, possibly including edge effects (sandhi). But sometimes, the resulting s-string must in addition conform to phonological rules (such as umlaut) that go beyond edge effects and may be specific to individual (classes of) daughters. In nonconcatenative morphology, the result of combination is nontrivial to begin with. The question, then, is how the particular phonological effects of combination are formally triggered by the elements combined. Given that the more complicated phonological effects on a parent are typically induced by affixes, one may expect this to be a consequence of the more powerful selectional mechanisms for morphemes.

In a sketch of inflexional morphology, Krieger & Nerbonne (1993) employs an unusually expressive way of lexical licensing. Words are supposed to contain a "stem" as value of a path morph stem and an "ending" as value of a path morph ending. There is a lexicon for objects of sort *word* as indicated in (10a) (p. 105), and there appears to be a second lexicon for *word* objects as indicated in (10b) (p. 122):

(10) a. *word →* ([morph ending e<sup>1</sup> *∧* synsem es<sup>1</sup> *∧* ed1] *∨ . . . . . . ∨* [morph ending e*<sup>m</sup> ∧* synsem es*<sup>m</sup> ∧* ed*m*]) b. *word →* ([morph stem s<sup>1</sup> *∧* synsem ss<sup>1</sup> *∧* sd1] *∨ . . . . . . ∨* [morph stem s*<sup>r</sup> ∧* synsem ss*<sup>r</sup> ∧* sd*r*])

Thus, (10a) requires each ending e*<sup>i</sup>* with 1 *≤ i ≤ m* to cooccur with a certain synsem value of the word, described by es*<sup>i</sup>* , and with further (e.g., phonological) properties of the word or some part of it, described by ed*<sup>i</sup>* ; and (10b) requires the same of each stem s*<sup>i</sup>* with 1 *≤ i ≤ r*.

In effect, then, the sets of disjuncts in (10a) and (10b) are lexicons for objects (endings and stems) that are proper components of a larger *word* object that satisfies the antecedent. Therefore, an embedded object can determine any property of the word it is a component of. Hence, lexicons like these can easily answer most questions of selection (including mutual selection of the components, if there is a pair of such lexicons) and can specify the effects of combination directly,

thereby answering the triggering question. Thus, the four topics remarked upon above receive a formally simple homogeneous treatment, just by the particular way of lexical licensing. However, expressive though this approach is, it has its limitations, as will be seen in a moment.

For a sketch of word structure, we assume a simple extension of the sort hierarchy below *sign*:


This sketch is simplified in many ways; e.g., it only allows for morphologically endocentric structures. An example from German may illustrate structures motivated on morphological grounds and their ensuing complexities.

The adjective *prüfungslos* 'examinationless' in Figure 4 <sup>14</sup> contains a suffix *-los* '-less' that derives adjectives from nouns. In it, the regular voicing alternation in German obstruents ([z *∼* s]) can be seen. I will not go into this; rather, the somewhat different alternation in Russian obstruents will be discussed in §7. *Prüfung* 'examination' is a noun derived from the free verbal stem *prüf-* 'examine' by the suffix *-ung* '-ation'. *-s-* is a "linking morpheme" (Fugenmorphem) that combines with a noun to the left to yield a bound complex that combines with certain suffixes, as in the present case, or with a free stem to the right. Thus, if being bound is analysed as a matter of selection, *prüfungs-* and *-los* must mutually select each other.

If the binary branching morphological structure assumed in Figure 4 is correct, the combinatorial properties of *-s-* cannot be captured by a set of lexicons for components of *complexmorph* objects in the manner of (10). A lexicon that contains (12a) (suitably enriched) as a member can account for *-s-* being bound to its left sister. But to capture the fact that its parent constituent is bound to its right sister, there would have to be another lexicon containing (12b) as a member. It surely is irritating that there should be two different lexical entries for *-s-*. But worse, the lexicon containing (12b) does not contain other members such that their disjunction could correctly capture the distribution of *-s-*.

<sup>14</sup>Here and later on, phonetic symbols that appear as (or in) list members are meant to informally indicate relevant properties of *segment* and *segmproper* objects. They do not indicate phonemic sorts. The attribute symbols morph, phon(ology) and s(egmental)-string are abbreviated m, p and s-s.

18 An architecture for phonology

Figure 4: Morphological structure of *prüfungslos*

(12) a. mhead [ *simplemorph* phon s-string *⟨*s*⟩* ] mnonhead … b. mnonhead mhead [ *simplemorph* phon s-string *⟨*s*⟩* ] mhead … 

Clarifying the interaction of lexical licensing, combinatorial properties of morphemes, and triggering the phonological effects of the combination of morphemes is thus left to future research. I henceforth concentrate on the effects themselves.

### **6 Nonconcatenative morphology**

Sierra Miwok is known for its multiform nonconcatenative morphology; see Smith (1985; 1986), Sloan (1991) and references therein. Part of its inflexional verbal stem formation has also received an illustrative HPSG analysis in Bird & Klein

(1994) (based on Goldsmith 1990: 83–95).

For a typical derivational pattern, we consider (13) with the monomorphemic bases in (14), after Smith (1985: 376f.):

(13) a. P*ojsi-li:p-* 'quadruplets'

	- b. *mah:oka-* 'five'
	- c. *na*P*a:ča-* 'ten'

The morpheme complexes in (13) conform to a template CVCCV plus a suffix 'lV:p', regardless of the form of the base, although the segmental substance is that of the base. The vowel of the suffix is type identical to the last vowel of the template. The third vowel of the base is elided, since it does not fit into the template.<sup>15</sup>

$$\begin{aligned} & \left[ \begin{array}{l} \text{complex} \\ \mathbf{p} \text{ s-s} \left< \begin{bmatrix} \text{short} \\ \text{s-con} \end{bmatrix}, \begin{bmatrix} \text{short} \\ \text{s-con} \end{bmatrix}, \begin{bmatrix} \text{short} \\ \text{s-con} \end{bmatrix}, \begin{bmatrix} \text{short} \\ \text{s-con} \end{bmatrix}, \begin{bmatrix} \text{short} \\ \text{s-con} \end{bmatrix}, \begin{bmatrix} \text{short} \\ \text{s-con} \end{bmatrix} \end{bmatrix} \mid \quad \boxed{\boxed{\mathbf{n}}} \right> \\ & \left[ \begin{array}{l} \text{implemomorphic} \\ \text{p-s-S} \left< \begin{bmatrix} \text{short} \\ \text{s-S} \end{bmatrix}, \begin{bmatrix} \text{long} \\ \text{s-O} \end{bmatrix}, \begin{bmatrix} \text{short} \\ \text{s-p} \end{bmatrix}, \begin{bmatrix} \text{short} \\ \text{s-p} \end{bmatrix} \right> \right] \\ & \left[ \begin{array}{l} \text{simple} \\ \text{p-s-S} \left< \begin{bmatrix} \text{short} \\ \text{s-R} \end{bmatrix}, \begin{bmatrix} \text{short} \\ \text{s-h} \end{bmatrix}, \begin{bmatrix} \text{short} \\ \text{s-o} \end{bmatrix}, \begin{bmatrix} \text{short} \\ \text{s-h} \end{bmatrix}, \begin{bmatrix} \text{short} \\ \text{s-h} \end{bmatrix}, \begin{bmatrix} \text{short} \\ \text{s-h} \end{bmatrix} \end{array} \right> \end{aligned} \right] \end{aligned}$$

Figure 5: Morphophonological structure of *mahko-lo:p-*

Some aspects of the intended analysis of (13b) can be seen in Figure 5. (mhead, mnonhead and segmproper are abbreviated h, n and s.) Like Scobbie (1997: 224f.), and unlike most work on nonconcatenative morphology, I see no reason to posit special attributes ("tiers/planes") just for consonants or vowels. The pair

<sup>15</sup>Elisions (and insertions of "default" vowels and consonants) are a well-known feature of Miwok morphology; cf. the references above. Ignoring this, Bird & Klein (1994: 468) asserts that "the phonology of a complex form can only be produced by either unifying or concatenating the phonologies of its parts."

18 An architecture for phonology

of encircled tags, '*⃝*1 ', indicates sort identity; in the present case, identity of the phonemic sort that [o] belongs to. For the reasons noted in the previous section, I leave open how the suffix (the h value) triggers the phonological form of its parent. We can see that the p s-string value is the CVCCV template, followed by the h p s-string value (tagged 2 ). The *consonant* objects of the template are *segmproper* objects of the n p s-string value, in left to right order; equally for the *vowel* objects.<sup>16</sup>

### **7 Morphophonology: Russian obstruents**

### **7.1 Background**

For an illustration of classical morphophonological considerations, we turn to the voicing alternation in Russian obstruents. This case is famous since Halle (1959: 21–24) used it in an argument against "empiricist" versions of phonology, effectively wrecking their distinction between phonemes and morphophonemes.

The case has gained additional fame through two kinds of ill-understood complications. First, the labiodental fricatives seem Janus-faced in that they partly pattern like ordinary obstruents, partly like sonorants (Jakobson 1956). Second, and somewhat similarly, a sonorant that immediately precedes an obstruent can, under certain conditions, pattern like the obstruent it precedes (Jakobson 1978). For attempts to capture the full range of data, see Wheeler (1988) and Kiparsky (1985: §2) (which both rely heavily on "underspecification"), and references therein.

Exciting though these complications are, I will disregard them and largely keep to the simplifying introductory description in Halle (1959: 22): "voicing is distinctive for all obstruents except /c/, /č/ and /x/, which do not possess voiced cognates. These three obstruents are voiceless unless followed by a voiced obstruent, in which case they are voiced. At the end of the word, however, this is true of all Russian obstruents: they are voiceless, unless the following word begins with a voiced obstruent, in which case they are voiced."

We thus find the voicing alternation at the end of the words in (15) (after Halle ib.) just like those in (16):

	- b. *žeč by* [ZedZb1] 'were one to burn'

<sup>16</sup>Here and throughout, the exposition of complex restrictions is highly informal. Explicit formulations would rely on the restricted theory of quantification and relations (based on King 1989) defined in Richter (1997: 22–35) and explored in Richter & King (1997). See also Richter (1999).

	- b. *gorod Baku* [gOr@dbaku]
	- c. *gorod* [gOr@t] (nom. sing.)
	- d. *goroda* [gOr@d@] (gen. sing.)

The affricate in (15a) as well as the alveolar plosive in (16a) are voiceless before the non-obstruent in the following word, but are voiced before the voiced obstruent in (15b), (16b). When nothing follows, as in (16c), obstruents are voiceless. Before a vowel in the same word, obstruents can be either voiced or voiceless, such as [d] in (16d) and [k] in (16b); but [dZ, dz, G] do not occur in this environment.

These regularities need to be detailed further in three respects (Halle 1959: 63f.). (i) By the "end of a word" is meant the end of a phonological word (a domain of accent rules). Most prepositions constitute a proper part of a phonological word; hence final obstruents in them are not devoiced when followed by a non-obstruent. (ii) By a "following word" is meant a following phonological word within the same "phonemic phrase." There is considerable freedom as to how many phonemic phrases any given utterance may contain. (iii) An "obstruent cluster," i.e., a sequence of consecutive obstruents, always conforms to the last obstruent in the cluster with regard to voicing. This observation applies to obstruent clusters within morphological signs and phonological words,<sup>17</sup> and is generalized in Halle (1959: 64) (following Jakobson) to clusters across boundaries of phonological words within a phonemic phrase.

To formally account for the fact that the s-strings of unembedded signs are articulated into phonological phrases, I hypothesize the feature declaration (17) and the restrictions (18) and (19):


<sup>17</sup>In a study of obstruent voicing assimilation in prepositions, Burton & Robblee (1997) has found overall acoustic evidence for regressive assimilation, but also subtle remnants of the underlying voicing properties. If these subtle effects prove to be reliable and significant, the question as to their articulatory cause arises. For present purposes I disregard them.

### 18 An architecture for phonology

I thus assume that the end of a phonological phrase coincides with the end of a phonological word. In the illustrative partial analyses below, I will assume that in simple cases, a phrase's pws (i.e., phonwords) value is the concatenation of the pws values of its daughters and a sign's s-string is a concatenation of the members of its pws value, as in Figure 6 below. (The latter condition fails to be satisfied in cases of sandhi, as in Figures 7 and 8.) This is not the general rule in morphology, though, and it is of course not true in the daughters of prepositional phrases in Russian.<sup>18</sup> Although these cases would deserve a systematic discussion, I follow the literature in being inexplicit about non-trivial details. (Cf. Inkelas & Zec 1995 for some discussion.)

Among the phonemic sorts for Russian are the ones in (20), with some of the attending restrictions given in (21). The *affricate* subsorts *sort*\_c and *sort*\_č as well as the *fricative* subsort *sort*\_x are unrestricted as to voicing, so that, e.g., both [x] and [G] are of sort *sort*\_x.


### **7.2 Ordinary obstruents**

As a first step, we consider a set of highly simplified rules that are close to Halle's (1959) introductory description:

(22) In a phonological phrase, the elements of an obstruent cluster C have the voicing value of C's last element.<sup>19</sup>

<sup>18</sup>I suggest that the lexical entries of most prepositions require the s-string to be a proper prefix of the (single) member of the pws value. In a PP headed by a preposition like that, the member of the preposition's pws value is the concatenation of its s-string and the first member of the complement daughter's pws value. Thus, the PP's pws value is the concatenation of the head daughter's and the complement daughter's pws values minus the latter's first member. The same sort of analysis can be applied to the indefinite articles *a* and *an* in English and also, probably, in morphology.

<sup>19</sup>The assumption that the voicing values are token identical is a speculation. They might just be type identical, with the empirical consequence for the velocity of articulator movement noted in our discussion of Sundanese nasalization in §4.


The ground rule for the relation of a parent's phon value to the phon values of its daughters is of course that the values of corresponding paths in segments of parent and daughter are identical. To be able to work properly, (22)–(24) also presuppose that the ground rule is not obeyed when path values cannot be identical due to the demands imposed on the parent by a rule. Thus, the rules must be complemented by appropriate specifications of delinking, a task not undertaken here.

Figure 6: Morphophonological structure of *gorod Baku* (provisional)

Example (16b) is partially analysed in accordance with (22)–(24) in Figure 6. Vowel reduction is disregarded. I assume that *gorod*, *Baku* and *Ufa* are simple morphemes and hence licensed as such by lexical entries, and that (16a–c) can be performed as complete utterances.

In Figure 6, no rule requires that any path value in any segment of a parent be different from a corresponding path value in a daughter. The only relevant 18 An architecture for phonology

requirement is (22): the voi(cing) values of the obstruents at the phonological word boundary (tagged 5 and 6 ) must be identical. This is unproblematic, as they happen to be of the same sort anyway.

The rules (22)–(24) can claim to be "surface-true." Although this property is sometimes considered a merit in itself, (24) appears doubtful. Why should it be that obstruents are voiceless at the end of words whenever, of all segments, just a vowel or sonorant follows? Devoicing is often seen in codas. This could in fact be the relevant factor in (23); but in (24), there is no reason to expect an obstruent to be in a coda just when followed by a vowel. Actually, in (16a), the devoiced obstruent is not in a coda but in a syllable onset, according to Weisser (1987: 76):

(25) [gO.r@.tu.fa]

(If this is correct, the domain of syllabification rules is the phonological phrase, rather than some smaller unit.) In any case, the conditioning factor for devoicing is clearly the end of the phonological word, quite independently of whatever follows. That is, if a grammar is not just meant to reproduce the data in some fashion, but also to capture "natural" rules that constitute a speaker's knowledge, (24) must be replaced by (26). (Thanks to (19), this rule subsumes the effects of (23).)

(26) In a *word* object, an obstruent at the end of a phonological word is voiceless.

Rule (26) is of course no longer surface-true: an obstruent that is voiceless according to (26) surfaces voiced just in case a voiced obstruent follows in the phonological phrase. This fact suggests that the generalization expressed by (22) might be spurious and that it should be replaced by the less general cluster rule (27) and a sandhi rule (28):


With (26)–(28) replacing (22)–(24), Figure 6 is no longer correct, as shown in Figure 7 (indications of pws values are simplified). By (26), the word *gorod* (tagged 21 ) ends in a voiceless obstruent, and by (28), the corresponding obstruent in the phonological phrase is voiced.

 *unembedded-phrase* p s-s <sup>20</sup> ⟨ 1 *,* 2 *,* 3 *,* 4 *,* [ s [ *sort*\_d voi <sup>10</sup> *voiced*]]*,* <sup>6</sup> [ s voi <sup>10</sup> ] *,* 7 *,* 8 *,* 9 ⟩ hierarch phonwords *⟨* <sup>21</sup> *,* <sup>22</sup> *⟩* phonphrases *⟨* <sup>20</sup> *⟩* dtrs *· · · · · · word* p s-s <sup>22</sup> *⟨* <sup>6</sup> *,* <sup>7</sup> *,* <sup>8</sup> *,* <sup>9</sup> *⟩* m [ *simplemorph* p s-s ⟨ 6 [ s *sort*\_b ] *,* 7 [ s a ] *,* 8 [ s k ] *,* 9 [ s u ]⟩] *· · · word* p s-s <sup>21</sup> ⟨ 1 *,* 2 *,* 3 *,* 4 *,* [ s [ *sort*\_t voi *voiceless*]]⟩ m *simplemorph* p s-s ⟨ 1 [ s g ] *,* 2 [ s O ] *,* 3 [ s r ] *,* 4 [ s O ] *,* [ s [ *sort*\_d voi *voiced*]]⟩ 

Figure 7: Morphophonological structure of *gorod Baku* (amended)

### **7.3 Obstruents with predictable voicing**

The voice-unrestricted segment types x, c and č have been problematic for certain theories of phonemics. Within phonological words and *morph* objects, any such segment is voiceless if it precedes a non-obstruent. If it precedes an obstruent, it is subject to (27). If it is the last segment of a word, it is subject to (26). The situation at the end of morphemes is less obvious, as is shown in the partial analysis of (15b) in Figure 8.

In the phonological phrase, č (tagged 7 ) is voiced, according to (28). At the end of the phonological word, č (tagged 6 ) is voiceless, according to (26). Nothing prevents č in the morpheme (tagged 3 ) to be voiceless too, so that possibly, 8 = 9 ; but nothing enforces this identity either. The lexical entry for *žeč* should certainly not fix the sort of č's voicing value. Neither can the ground rule and the delinking specifications attending the individual rules be balanced in such a way that necessarily 8 = 9 . (The same problem arises with obstruent clusters across morpheme boundaries within words.)

Naturally, no incorrect observational predictions ensue if this question is just

18 An architecture for phonology

 *unembedded-phrase* p s-s <sup>20</sup> ⟨ 1 *,* 2 *,* 7 [ s [ *sort*\_č voi <sup>10</sup> *voiced*]]*,* <sup>4</sup> [ s voi <sup>10</sup> ] *,* 5 ⟩ hierarch phonwords *⟨* <sup>21</sup> *,* <sup>22</sup> *⟩* phonphrases *⟨* <sup>20</sup> *⟩* dtrs *· · · · · · word* p s-s <sup>22</sup> *⟨* <sup>4</sup> *,* <sup>5</sup> *⟩* m [ *simplemorph* p s-s ⟨ 4 [ s *sort*\_b ] *,* 5 [ s 1 ]⟩] *· · · word* p s-s <sup>21</sup> ⟨ 1 *,* 2 *,* 6 [ s [ *sort*\_č voi <sup>9</sup> *voiceless*]]⟩ m *simplemorph* p s-s ⟨ 1 [ s *sort*\_Z ] *,* 2 [ s e ] *,* 3 [ s [ *sort*\_č voi 8 ]]⟩ 

Figure 8: Morphophonological structure of *žeč by*

left open. But this (non-)decision forces upon us genuinely spurious ambiguities: for each word that ends in a voice-unrestricted obstruent sort, there are two candidate *simplemorph* objects that differ in the sort of the voicing value of the morpheme-final obstruent. If a grammar is meant to capture the linguistic knowledge of speakers, nothing can justify an attribution to speakers of knowledge of such an ambiguity. Therefore, the rule for objects belonging to a voiceunrestricted sort is posited as in (29):

(29) In a *simplemorph* object, a p s-string value component of sort *sort*\_c, *sort*\_č or *sort*\_x is voiceless if it does not precede an obstruent.

Given that the voicing of an obstruent at the end of a morpheme must in general be inferred on the evidence of the morpheme occurring before a vowel (or a sonorant) in a phonological word, (29) is perfectly natural. Thus, by (29), č in the morpheme *žeč* in Figure 8 is voiceless. By the ground rule, then, 8 = 9 and hence, 3 = 6 .

### **7.4 Concluding considerations**

According to the rule system (26)–(29), Russian has a special end-of-word rule (26), which is nothing unusual, and a sandhi rule (28) that is independent of the word-internal cluster rule (27). On comparative grounds, both rules are far more natural than (24). One can expect, then, that Slavic languages (whose obstruents show similar behaviour, by and large) vary (28) independently of (27). As we have noted in §2.2, this is just what happens in southwestern variants of Polish (cf. Bethin 1984, Gussmann 1992: 34 and 54, Rubach 1996: 72 and 82f.): there, (27) and (26) are (basically) also in force, but in the counterpart to (28), 'obstruent B' is to be replaced by 'segment B'.

Moreover, it is possible that the sandhi rule (28) is actually not phonemic but phonetic in nature; cf. Kiparsky (1985) for references. This might mean that the voicing achievement values of obstruents, rather than their voicing values, are critically affected by sandhi. It might also mean that (28) should actually regulate not s-strings but p-strings. This is suggested by the observation in Isačenko (1954/55: 415) (confirmed in Halle 1959: 64, note 15) that in examples such as *rež' bulku* 'cut the bread' the fricative typically sets in voiceless. This fact appears problematic upon (22) when the fricative is lexically voiced, but may be easier to understand upon (26) plus a modified version of (28). Conceivably, though, it is a rather direct consequence of there being just one long (hence, slow) voicing gesture throughout the obstruent cluster. To clarify these questions, more detailed data are required than are available to me.

In the discussion of Russian obstruents above, several noteworthy points should have become apparent. First, important questions of empirical detail notwithstanding, the requirements of lexical licensing and of rule naturalness strongly motivate non-trivial forms of multistratality. Second, although the relation of a parent's phon value to those of its daughters (as envisaged in (26)–(28) in conjunction with the ground rule and the delinking specifications) is intuitively transparent, its logic is remarkably complex. Specifying it in full detail is some work even with the resources referred to in note 16 above. Third, the hierarchical structure imposed by phonwords and phonphrases values is non-trivial just in case it is not homomorphic to morpho-syntactic structure. But because of the lack of detailed research, we fail to have a general well-founded view of how to construe the relation explicitly for non-trivial cases.<sup>20</sup>

<sup>20</sup>To account for word order phenomena in Serbo-Croatian, Penn (1999) proposes a structure for signs that differs significantly from my highly conservative proposals (which can, in principle, be combined with the approach to linearization put forward in Richter 1997 or in Sailer 1997). Considerable exploratory work will be needed to assess the merits of either proposal.

### **8 Summary of architecture**

A natural language is conceived to be a set of totally well-typed token linguistic objects. Among them, objects of sort *unembedded-phrase* are prominent in that they alone can be performed as utterances. They bear a distinguished phonological attribute utterance. Its value's s-string value (its "p-string") is mapped to a u-equivalence (a maximal set of stylistically alternative possible utterance events) by an interpretation function Φ.

Φ is defined by a physical theory that has a universal core, but allows certain details to be learned for individual languages. For a "grammar G of natural language L," L is (intended to be) an exhaustive model of G. Knowledge of L is thus partly embodied in G and partly, in the theory defining Φ.

An object's utterance s-string value is related, but not necessarily identical, to its phon s-string value, providing room for phonetic regularities that are not captured by the phon s-string value (or by Φ) alone. Components of phon sstring values need not be physically interpreted, although they are required to be interpretable.

The phon value of a sign is related to the phon values of its component signs. Words embed (morphological) signs, which may again embed signs (recursively). The relation of a sign's phon value to those of its component signs thus provides room (hypothesized to be both necessary and sufficient) for "postlexical" as well as "lexical" morphophonology.

"Long distance" identities in strings of segments are necessarily type (as opposed to token) identities. Identities in adjacent segments can (but need not) be token identities, since segments allow for massive gestural overlap. Notions from classical phonemics, which capture constant coupling of different gestural objects in segments, can be exploited (and explored) with the help of phonemic sorts (partitionings of major class and manner sorts).

### **References**


Ladefoged, Peter. 1980. What are linguistic sounds made of? *Language* 56. 485– 502.

Ladefoged, Peter. 1990. On dividing phonetics and phonology: Comments on the papers by Clements and by Browman and Goldstein. In John Kingston & Mary E. Beckman (eds.), *Between the grammar and physics of speech*, vol. 1 (Papers in Laboratory Phonology), 398–405. Cambridge: Cambridge University Press.


Abraham, Werner, 150, 287 Adelung, Johann Christoph, 28, 39 Ait-Kaci, Hassan, 506 Akmajian, Adrian, 134, 152 Allerton, David J., 144 Altmann, Hans, 70, 111, 117, 118 Andersson, Lars-Gunnar, 30, 422 Aoun, Joseph, 329, 343 Aronoff, Mark, 223, 245 Bader, Thomas, 405, 477, 478, 481 Bagemihl, Bruce, 573 Baker, C. Leroy, 56, 67 Barry, Guy, 493, 540, 541 Barry, Martin C., 577 Bartsch, Renate,109,123,129,131,136, 147, 170 Basri, Hasan, 332 Battistella, Edwin L., 356 Bayer, Josef, 410 Bean, Marian C., 113 Bech, Gunnar, 101–104, 193, 280, 283 Beck, Sigrid, 452 Becker, Karl Ferdinand, 40, 286 Behaghel, O[tto], 418 Behaghel, Otto, 194 Bell-Berti, Fredericka, 580 Bessell, Nicola J., 580 Besten, Johannes B. den, 404 Bethin, Christina Y., 600 Bierwisch, Manfred, 41, 43, 55, 111, 114, 115, 288

Bird, Steven, 571, 573, 579, 591, 592 Blümel, Rudolf, 49, 287 Boër, Stephen R., 133, 134 Bokamba, Eyamba G., 430 Bont, A. P. de, 418, 568 Booij, Geert E., 319 Borsley, Robert D., 417 Bothorel-Witz, Arlette, 468 Bouma, Gosse, 462 Boyce, Suzanne E., 580 Braine, Martin D. S., 56 Brame, Michael K., 125 Broe, Michael, 576 Browman, Catherine P., 577–579, 586 Brunner, Karl, 419, 420, 566 Burton, Martha W., 594 Calabrese, Andrea, 576 Carpenter, Bob, 501, 503, 506, 508 Carson-Berndsen, Julie, 571 Chisholm, David, 242 Chomsky, Noam, 103, 104, 118–120, 129, 135, 142, 222, 223, 261, 306, 308, 322, 359, 360 Cinque, Guglielmo, 505 Clahsen, Harald, 59, 65 Clark, Herbert H., 112, 123, 127 Clements, George N., 573 Clumeck, Harold, 586 Cohn, Abigail C., 587 Coleman, John, 585 Comrie, Bernard, 478, 481

Contreras, Heles, 131, 138, 168 Cooper, Richard Paul, 493 Cooper, Κathrin E., 478, 481 Cruttenden, Alan, 144 Culicover, Peter W., 56, 58, 60, 510 Curme, George O[liver], 461, 477 Dahl, Östen, 138 Daneš, František, 8, 9, 16 Daube, Ernst Sporgel, 469, 470, 478 Dayal, Veneeta Srivastav, 443, 450 Dellit, Otto, 476, 478, 479 den Besten, Hans, 373 Dik, Simon et al., 383 Döring, Edmund, 462, 467, 474 Dowty, David R., 320 Drach, Erich, xxii, 42, 49, 79, 80, 289 Eggenberger, Jakob, 421, 566 Eisenberg, Peter, 95, 98, 100, 101, 104 Engstrand, Olle, 580 Engdahl, Elisabet, 345, 354, 356, 359, 412, 423 Engel, Ulrich, 290 Entjes, H[einrich], 314, 420, 421, 566 Epée, Roger, 428, 429 Erben, Johannes, 290 Erdmann, Oskar, 37, 38, 41, 43, 44, 48, 169, 173, 287, 288 Erteschik-Shir, Nomi, 103, 120, 145 Evans, Gareth, 134 Evers, Arnold, 103, 104 Faarlund, Jan Terje, 30 Fabb, Nigel, 589 Finer, Daniel L., 332 Firmenich, Johann Matthias, 474, 475 Fodor, Janet Dean, 330 Frank, Julius, 475 Frauenfelder, Uli, 478, 481 Frege, Gottlob, 23, 127, 152 Frey, Werner, 372, 373, 377 Fuchs, Anna, 124, 126, 137, 142, 144, 150 Fuckel, Arthur, 418 Fukui, Naoki, 301, 323, 376 Gabbay, Dov M., 330 Gabelentz, Georg von der, 47, 48, 288 Gafos, Diamandis, 580 Gay, Thomas, 580 Gazdar, Gerald, 491, 492, 504, 510, 511 Gering, Hugo, 421 Givón, Talmy, 166 Goldsmith, John A., 571, 576, 592 Goldstein, Ira P., 503 Goldstein, Louis, 577–579, 586 Goodall, Grant, 319 Goossenaerts, J[ozef], 418 Götzinger, Maximilian Wilhelm, 288 Graebisch, Friedrich, 468 Greenberg, Joseph H., 12–15, 17, 18, 20, 27, 28, 86, 88, 288 Griesbach, Heinz, 49, 110, 128, 167, 172, 287, 290 Grimm, Jacob, 477 Grimme, Hubert, 421 Guéron, J[acqueline], 346, 356 Gussenhoven, Carlos, 383, 408 Gussmann, Edmund, 573, 600 Guthrie, Malcolm, 429 Haan, Ger[men] J. de, 292 Haan, Germen [J.] de, 419, 568

Haegeman, Liliane, 463

Flege, James Emil, 578

Flickinger, Dan, 501, 502, 540

Haeringen, C[oenraad] B[ernardus] van, 424, 568 Hajicǒvá, Eva, 120, 133, 138 Halle, Morris, 222, 223, 261, 593, 594, 600 Halliday, Michael A. K., 142 Hankamer, Jorge, 194 Hanke, Lothar, 468 Hardcastle, William J., 571 Harris, Katherine S., 580 Harris, Zellig S., 7 Hatcher, Anna Granville, 144 Haushalter, Β[runo], 474, 475 Havers, Wilhelm, 71 Haviland, Susan E., 112, 123, 127 Heidolph, Karl Erich, 115, 144, 155 Heilmann, Axel, 476 Herling, Simon Heinrich Adolf, 22, 23, 41, 42, 48, 50, 60, 285, 286, 288 Hermann, Eduard, 418, 480 Hermkens, H. M., 418 Hertel, L[udwig], 479 Hetland, Jorunn, 381 Hiemstra, Inge, 439, 443, 444, 446 Hinrichs, Erhard W., 496, 539, 546 Hoberg, Ursula, 287 Hockett, Charles F., 299 Hodler, Werner, 478 Hoekstra, Eric, 483 Höhle, Tilman N., vi, viii, xi, xx, 4, 50, 55, 61, 73, 93, 103, 104, 107, 133, 134, 137, 152, 219, 220, 223, 226, 227, 261, 264, 265, 288, 291, 297, 314, 318, 319, 324, 326, 329, 339, 381, 384, 398, 405, 435, 436, 463, 532, 539, 576

Horvath, Julia, 439 Houtman, Joop, 320 Hudson, Richard, 417 Hukari, Thomas E., 493, 532 Hume, Elizabeth, 573, 579 Hust, Joel R., 125, 224 Hutchinson, Larry, 209 Hyman, Larry M., 573 Inkelas, Sharon, 595 Isačenko, Alexander V., 600 Ittmann, Johannes, 427 Jackendoff, Ray,125,127,134,138, 221, 224 Jacobs, Joachim, 287, 291, 330, 333, 400, 413 Jacobson, Pauline, 356 Jakobson, Roman, 9, 593 Jones, Morris, 26 Jun, Jongho, 577, 587 Kasher, Asa, 330 Kathol, Andreas, 301, 329 Katz, Jerrold J., 56, 57 Kayne, Richard, 405 Kean, Mary-Louise, 576 Keenan, Elinor O., 123 Kempen, Gerard, 463 Kempson, Ruth M., 121, 122, 136, 158 Kenstowicz, Michael, 571, 579 Kepser, Stephan, 501 Kiefer, Ferenc, 167 King, Paul John, 501, 508, 571, 572, 575, 593 Kiparsky, Paul, 109, 115, 263, 575, 593, 600 Kirkwood, Henry W., 110

Holst, Friedrich, 234

Kiss, Katalin É., 336, 439, 450 Kiss, Tibor, 496 Kitagawa, Yoshihisa, 323, 356 Klein, Ewan, 579, 591, 592 Klein, Rudolf Martin, 29 Klima, Edward S., 55, 330 Koch, Ch. Friedrich, 45–47, 288 Kohler, Klaus J., 584 Kohrt, Manfred, 194, 318 Koster, Jan, 103, 311 Krieger, Hans-Ulrich, 588, 589 Kröger, Bernd J., 587 Kuno, Susumu, 82 Kunze, Jürgen, 194 Kurrelmeyer, William, 463 Labouvie, Erich, 468 Ladefoged, Peter, 571, 573, 578, 586, 587 Lakoff, George, 158 Langacker, Ronald W., 225 Langendoen, D. Terence, 356 Lappin, Shalom, 120 Lasch, Agathe, 566 Lasnik, Howard, 103, 104, 358 Latour, Bernd, 251 Laver, John, 571 Lehman, Christina, 123 Lenerz, Jürgen, 110, 175, 179, 180, 183, 184 Levine, Robert D., 493, 532 Lie, Svein, 320 Local, John, 577 Lodge, Ken, 577 Longobardi, Giuseppe, 342 Luthardt, Emil, 473, 483, 485 Maddieson, Ian, 571, 578, 587 Maling, Joan M., 30, 185

Marácz, László, 439 Marle, J[aap] van, 472 Mastroianni, Michael, 573, 580 Maurer, Friedrich, 466 McAllister, Robert, 580 McCarthy, John J., 67 McCloskey, James, 26, 452, 458 McDaniel, Dana, 436, 437, 439, 445, 447, 448, 457, 458 McGowan, Richard S., 585 Meer, Geart van der, 418 Merkes, Peter Wilhelm, 477 Meurers, Walt Detmar, 462, 477, 529, 533, 542 Mey, Sjaak de, 439 Mohanan, Karuvannur P., 586, 588 Moshier, M. Drew, 540 Müller, Stefan, 462 Munhall, Kevin G., 585, 587 Nakazawa, Tsuneko, 496, 539, 546 Neijt, Anneke, 196, 296, 312, 318–320 Nerbonne, John, 501, 540, 588, 589 Nerger, Karl, 420 Neubauer, Paul, 356 Noack, Fritz, 474 Nolan, Francis, 577 Nordmeyer, Ernst, 42, 43, 48, 79 Odden, David, 577 Oertel, Hanns, 69, 70 Oirsouw, Robert R. van, 319 Orgun, Cemil Orhan, 588

Pafel, Jürgen, 330, 333, 335, 336 Park, Tschang-Zin, 25, 26, 29, 59, 65 Partee, Barbara H., 320, 350, 355 Pasch, Ed[uard], 469 Pasch, Renate, 120, 122

Patocka, Franz, 464, 468 Paul, Hermann, 421, 566 Penn, Gerald, 600 Penner, Zvi, 405 Perkell, Joseph S., 586 Perlmutter, David, 579 Philipp, Marthe, 468 Pickering, Martin, 493, 494, 540, 541 Pierrehumbert, Janet, 585 Plann, Susan, 404 Platzack, Christer, 292 Plessis, Hans du, 447 Pollard, Carl, 422, 493, 495, 500–505, 507–510, 512, 522, 527, 529, 532, 533, 539, 540, 542–544, 546, 547, 549, 562, 571, 572, 588 Ponelis, Fritz A., 447 Prince, Ellen F., 151, 158 Reed, Ann M., 356 Regel, Karl, 467, 472, 480 Reichardt, Edinhard, 468, 476, 480, 486 Reinhard, Sabine, 462 Reis, Marga, 104, 152, 280, 390 Rhodes, Richard A., 136 Richter, Frank, 462, 583, 588, 593, 600 Riemsdijk, Henk van, 355, 435, 444, 448 Robblee, Karen E., 594 Roberts, Craige, 346 Roberts, R. Bruce, 503 Rochemont, Michael Shaun, 127, 131, 133, 135 Rooth, Mats, 320, 350, 355 Rosenkranz, Ηeinz, 474 Ross, John Robert, 195 Rouveret, Alain, 356

Rudolph, Fritz, 474 Safir, Ken, 298 Sag, Ivan A., 296, 330, 422, 493, 495, 500–503, 505, 507–510, 512, 522, 527, 529, 532, 533, 539, 540, 542–544, 546, 547, 549, 562, 571 Sagey, Elizabeth, 579, 580, 585 Sailer, Manfred, 588, 600 Saito, Mamoru, 342, 343 Saltzman, Elliot L., 585, 587 Sanders, Daniel, 39 Sarauw, Chr[istian], 420, 566 Schachtschabel, Οtto, 466 Schauber, Ellen, 136 Schleicher, August, 473, 475 Schmeller, Joh[ann] Andreas, 476 Schmerling, Susan F., 112, 114, 144, 158, 187 Schmid, Tanja, 462, 463 Schwarz, Bernhard, 453 Scobbie, James M., 573, 579, 580, 592 Seuren, Pieter A.M., 463 Sgall, Petr, 120, 133, 138, 142 Shieber, Stuart M., xx Shopen, Tim, 323 Siegel, Dorothy, 223 Sloan, Kelly Dawn, 591 Smith, Caroline L., 579, 587 Smith, Norval, 591, 592 Smyth, Ronald H., 136 Solé, Maria-Josep, 586 Sommer, Anton, 471, 478, 485 Spangenberg, Karl, 464, 474 Speas, Margaret, 301

Rowley, Anthony R., 464 Rubach, Jerzy, 600

Sperschneider, Heinz, 462, 472, 473, 480, 483 Spieß, Balthasar, 467 Stechow, Arnim von, 118, 122, 436 Sternefeld, Wolfgang, 436 Steube, Anita, 479, 482 Stockwell, Robert P., 319 Stolt, Birgit, 290 Stonham, John T., 589 Strauss, Steven L., 256 Takizala, Alexis, 430 Tappe, Hans-Thilo, 372, 373, 377, 442 Taraldsen, Knut Tarald, 422, 423, 559, 562 Terazu, Noriko, 319 Teuchert, H[ermann], 418, 568 Thiersch, Craig, 342, 373 Thomas, Alan R., 26 Toman, Jindřich, 220, 227, 245, 247, 318, 435 Tomlin, Russell S., 136 Travis, Lisa deMena, 301 Trebs, Emil, 464 Trissler, Susanne, 457 Uriagereka, Juan, 358

Vat, Jan, 70 Vater, Heinz, vi Vater, Johann Severin, 23 Veldman, Fokko, 418, 568 Vergnaud, Jean-Roger, 356 Verhagen, Arie, 125, 131 Vögeding, Joachim, 220, 234

Wasow, Thomas, 355 Webelhuth, Gert, 373 Weber, Edelgard, 474 Wegera, Klaus-Peter, 474 Weil, Henri, 48 Weise, Oskar, 464, 469, 471 Weisler, Steven, 356 Weiss, Daniel, 152 Weisser, Franz, 597 Weldner, Heinrich, 466, 471, 480, 481, 483–485 Wesche, Birgit, 320 Wexler, Kenneth, 56, 58, 60 Wheeler, Deirdre, 593 Wild, Katharina, 474 Williams, Edwin, 256, 257, 306, 324, 346, 355, 356 Wilmanns, Wilhelm, 45 Wolf, Norbert Richard, 474 Wunderlich, Dieter, 297 Wunderlich, Hermann, 49 Wurzel, Wolfgang Ulrich, 223, 271

Zaenen, Annie, 30 Zec, Draga, 595 Zoll, Cheryl, 576 Zwart, Cornelius Jan Wouter, 424, 568

## **Language index**

Altenglisch, 419–421 Althochdeutsch, 421

Bantu, 427

Deutsch, 7, 9, 11, 12, 19–21, 21<sup>7</sup> , 22, 24, 25, 26<sup>10</sup> , 27, 27<sup>11</sup> , 28, 28<sup>13</sup> , 29, 29<sup>15</sup> , 30, 30<sup>16</sup> , 31–33, 37–42, 44, 47, 48<sup>21</sup> , 54, 57, 58, 60, 62, 65, 67, 70, 95, 107, 118, 129, 136<sup>21</sup> , 138, 173, 182, 185, 193, 195, 209, 279, 284, 285<sup>6</sup> , 287, 288<sup>11</sup> , 289, 289<sup>12</sup> , 292, 369, 375, 376, 378, 386<sup>3</sup> , 404, 404<sup>10</sup> , 408, 408<sup>14</sup> , 417, 426, 503 Duala, 427, 429, 430 Dutch, xi–xiv, 314<sup>1</sup> , 461, 462, 466<sup>10</sup> , 472, 477, 566–568 Eastern, 558 Dzamba, 429, 430 Dänisch, 30<sup>16</sup> , 292 Englisch, 9, 14, 20, 21, 26, 29, 30, 42, 62–65, 136<sup>21</sup> , 145, 209, 376, 377, 417, 422–424, 427, 495 English, xiii, xiv, 20, 256<sup>13</sup> , 297, 307, 308, 318<sup>2</sup> , 324<sup>8</sup> , 328, 342, 343, 343<sup>22</sup> , 355–357, 358<sup>32</sup> , 360– 362, 457<sup>16</sup> , 500, 554–556, 559, 562, 565–566, 578, 586, 587, 595<sup>18</sup>

Französisch, 14, 42 Friesisch, 292, 420 Frisian, 461 Färöisch, 292 German, xii, xiii, 438, 440, 442, 444, 452<sup>14</sup> , 457, 457<sup>16</sup> Austrian, 578 German-Dutch, 462, 462<sup>2</sup> Germanisch, 404 Nord-, 11, 42 High German, 461 Hungarian, 336<sup>18</sup> , 436, 439, 442<sup>5</sup> , 450 Irisch, 26<sup>10</sup> Isländisch, 30<sup>16</sup> , 292 Japanisch, 15, 82<sup>38</sup> Jiddisch, 292<sup>15</sup> Keltisch, 11, 26<sup>10</sup> , 42, 404, 427 Kihung'an, 429 Kymrisch, 26<sup>10</sup> Low German, 461, 462<sup>3</sup> , 472, 568 Mecklenburgisch, 420 Middle High German, xii, 566 Middle Low German, xii, 566 Mittelhochdeutsch, 421 Mittelniederdeutsch, 420, 421 Miwok, 572, 591–593

### Language index

Niederdeutsch, 418, 419<sup>1</sup> , 420, 421 Niederländisch, 11, 19, 29<sup>15</sup> , 292, 369, 386<sup>3</sup> , 404, 404<sup>10</sup> , 408<sup>14</sup> , 420, 421 Nordfriesisch, 418, 419<sup>1</sup> Nordniederländisch, 419<sup>1</sup> Norwegian, xiii, xiv, 559, 568 Norwegisch, 30<sup>16</sup> , 292, 381 , 422, 423 Old English, xi, 566 Old Frisian, 568 Old High German, xii, 566 Ostfälisch, 461 Ostniederländisch, 420 Polish, 600 southwestern, 576 Romani, 439, 447, 457, 457<sup>16</sup> Russian, xiv, 16, 572, 575, 576, 590, 593–600 Russisch, 9, 11, 16 Scandinavian, xii, 559–565 Schwedisch, 30<sup>16</sup> , 292, 381 , 422, 423 Semitic, 580 Skandinavisch, 292, 292<sup>15</sup> , 377, 421, 423, 428 Spanisch, 136<sup>21</sup> , 138, 404<sup>10</sup> Spanish, 586 Sundanese, 587, 595<sup>19</sup> Swahili, 429 Swedish, xiii, xiv, 559 Turkish, 580 Westfriesisch, 418, 419<sup>1</sup> Yiddish, 462<sup>3</sup>

Adjunkt, 369, 493, 532 Adverbiale, 23, 27<sup>11</sup> , 28, 29, 46, 94, 95, 125, 177, 178, 212–216, 369 Adäquatheit, 94, 98 Akkusativ, 52, 53, 171<sup>30</sup> , 177, 181 Akkusativobjekt, 52, 53,128<sup>16</sup> ,147,171<sup>30</sup> 503, 515 Anapher, 69–72, 72<sup>33</sup> , 75, 76, 76<sup>34</sup> , 77, 78, 135<sup>20</sup> , 154, 155, 158–161, 205, 206, 209 anaphorisch, 154 Anfangsstellung, 126<sup>14</sup> , 389, 393, 398, 401, 403 append, 506, 507, 523 Basisposition, 376, 417, 419, 420, 425, 430 Betonung, 9, 35, 108–110, 112<sup>2</sup> , 114– 116, 118, 118<sup>7</sup> , 119, 126, 130, 131,131<sup>18</sup> ,132,134,136<sup>21</sup> ,138, 139, 141, 142, 142<sup>22</sup> , 143–145, 149, 150, 150<sup>24</sup> , 152–154, 157, 161,164,165,167,171,174,179, 180,184<sup>36</sup> ,186, 381, 382, 384– 389, 391, 392, 395, 396, 400, 402, 406–408, 408<sup>14</sup> , 410–415 Betonungsmuster, 139, 140, 148, 157 CELR, 506, 507, 512, 516, 539, 542, 543, 546 Dativ, 52, 171<sup>30</sup> , 177, 181

,

Dativobjekt, 52, 53, 199, 503 Deklarativsatz, 24, 36, 39, 47,198, 415 dominant, 120<sup>9</sup> eingebettet, 49, 50, 83, 158, 285, 392, 394, 529 Einheitsplural, 420, 425 Einzelsprache, 14, 66, 185 emphatisch, 142<sup>22</sup> , 388 Endstellung, 28<sup>14</sup> , 65, 401–403 Exklamativ, 388, 390 extrahiert, 423, 426, 428, 504, 510– 512, 532 Extraktion, xiii, 428, 493, 504, 505, 514, 523–525, 527, 533, 535 Extraposition, 95, 98–100, 102, 103, 297 Flexion, 40, 64, 65, 286 Flexionsform, 40, 124, 193, 286, 382 Fokus, 119, 120, 120<sup>8</sup> , 120<sup>9</sup> , 121, 122<sup>10</sup> , 123,123<sup>11</sup> ,124,125,125<sup>13</sup> ,126<sup>14</sup> , 127,128,128<sup>16</sup> ,129,129<sup>17</sup> ,130, 131<sup>18</sup> ,132,133,135,136,136<sup>21</sup> , 137–140, 142, 142<sup>22</sup> , 143, 147, 147<sup>23</sup> ,148,149,150<sup>24</sup> ,151,151<sup>25</sup> 152–157, 157<sup>27</sup> , 158–160, 166, 168,170,171<sup>30</sup> ,179–181,184<sup>36</sup> , 291, 382–385, 387–391, 393– 398, 398<sup>6</sup> , 399–404, 406–408, 408<sup>14</sup> , 409–413, 413<sup>17</sup> , 414 semantischer, 123

,

Fokusexponent, 138, 148, 149, 150<sup>24</sup> , 385, 410, 411, 413 Fokusprojektion, 137–139, 142, 143<sup>22</sup> , 144, 145, 148, 150<sup>24</sup> , 151–154, 164–166, 168–170, 181, 291, 385, 402 fokusprojektiv, 139, 150, 157 Fragesatz, 161 Gapping, 79, 83, 194–197, 204, 214, 215, 296<sup>1</sup> , 315, 316, 318, 320 Generalisierung, 98, 502 GPSG, 491, 492, 494, 540, 543 Gradpartikel, 393<sup>5</sup> Hauptakzent, 114, 115, 157 Hervorhebung,18,113,114,131<sup>18</sup> ,136<sup>21</sup> , 385, 392, 393, 402, 403, 407, 412 Hervorhebungseffekt, 399, 407 Hilfsverb, 20, 21<sup>7</sup> , 22, 24, 26<sup>10</sup> , 30, 45, 50, 64 HPSG, xiii, xiv, 491, 492, 494, 496, 535, 540, 571, 575, 591 Illokutionstyp, 389, 391, 392, 394, 397, 401, 415 Imperativ, 54, 193, 286<sup>7</sup> , 418, 419 Imperativsatz, 17, 198 Implikation, 65, 122<sup>10</sup> , 213, 500–502, 506, 523, 525, 526, 529 Infinitiv, 50<sup>22</sup> , 54, 74, 75, 102, 102<sup>3</sup> , 280, 284, 386, 386<sup>3</sup> , 387, 418, 419, 428 Infinitivkonstruktion, 53, 102, 283<sup>4</sup> Interrogativpronomen, 20, 33, 35, 36, 193, 389 Interrogativsatz,17, 36<sup>18</sup> , 74, 207, 372, 389, 390, 415, 422, 423

Intonation, 34, 71, 81, 110 intonation,109,110,112,120<sup>9</sup> ,142,147, 330, 330<sup>14</sup> , 331–335, 336<sup>18</sup> , 337, 338, 344, 345, 348, 437, 440 intonatorisch, 81, 116, 126<sup>14</sup> Inversionsform, 420, 421, 425 Kasus, 52, 53, 69, 70, 172<sup>32</sup> Kohärenzfeld, 101, 280, 283, 283<sup>4</sup> Komplement, 422–424, 493, 504, 522, 524, 525 Komplementierer, 417, 418, 422–425, 427, 429 Konditionalsatz, 36, 77, 392 kongruent,195,199–201, 204, 206, 208, 209, 216 Konjunkt, 122, 123, 141, 158–160, 194, 197, 199–202, 204–207, 209, 210, 212–216, 284, 378 Konjunktion, 48, 64, 83, 200, 414, 500 Konstituente, 44, 52, 53<sup>23</sup> , 58, 60, 68– 71, 71<sup>32</sup> , 73, 74, 76–78, 81, 81<sup>37</sup> , 84, 96, 98<sup>1</sup> , 98<sup>2</sup> , 109, 114, 115, 125<sup>13</sup> , 126<sup>14</sup> , 128, 129, 129<sup>17</sup> , 136–138, 140, 142, 142<sup>22</sup> , 157, 166,169<sup>29</sup> ,195,197–200, 203– 209, 211, 216, 280, 285, 287, 289, 291, 370, 375–377, 397, 406, 414, 415, 426, 491, 492, 495, 499 Konstituentenfolge, 165, 166, 168, 171 Kontexttyp, 123, 157, 179 kontrastiv, 142<sup>22</sup> kontrastive Betonung, 109 Koordination, 60, 82<sup>38</sup> , 193–198, 201, 203–207, 209–212, 214–216, 418, 419 koordinierende Konjunktion, 197

Kopula, 40, 46, 386<sup>3</sup> , 402, 403 Koreferenz, 134, 134<sup>19</sup> , 135 leere Relativphrase, 422, 428, 429 Lexikonregel, 502, 504, 508–512, 524, 527, 529, 532, 535 Linkstilgung, 194, 196–198, 204, 216 Linksversetzung, 69, 69<sup>31</sup> , 70–73, 78 markierte Abfolge, 176, 177, 180–182 mehrfache Extraktion, 505, 512 minimaler Fokus, 384 morphologisch, 37, 114, 132 Nachfeld, 4, 11<sup>2</sup> , 99, 100, 289<sup>13</sup> , 290, 406 Negation, 115, 124, 125, 133, 148, 166, 216, 396, 398<sup>8</sup> , 399–401, 501 neutrale Abfolge, 32 nominal, 12, 14–17, 228, 231, 255, 272, 273, 275, 277, 405, 441–443, 446, 448 Nominalphrase, 69, 71, 82<sup>38</sup> , 151, 205, 285, 411 Nominativ, 51–54, 70, 71<sup>32</sup> , 75, 173 Normalbetonung,109,111–113,131,141– 144, 147, 148, 156, 157, 162, 166, 167, 171, 179, 185 normale Abfolge, 176, 178, 182 NP, 99, 134, 150<sup>24</sup> , 151, 151<sup>25</sup> , 152, 153, 155,156,169<sup>29</sup> , 306, 314<sup>1</sup> , 318<sup>2</sup> , 320–324, 330, 330<sup>13</sup> , 331–335, 337, 341, 342, 372, 373, 451, 458, 496, 555 Operator, 125<sup>13</sup> , 126, 126<sup>14</sup> , 389, 391, 392, 394, 397 OSV, 12, 16, 18 OV, 14 OVS, 12, 16

Partikel, 50<sup>22</sup> , 58, 81–83, 395, 396, 398, 407, 408, 408<sup>14</sup> , 410, 412, 414, 421 Partizip, 74, 280, 386, 386<sup>3</sup> Personalpronomen,151<sup>25</sup> ,152–155,159, 177, 419, 426 Plural, 37, 193, 419–421, 425 Position des Verbs, 29, 40 pragmatisch, 174 Projektion, 139, 166, 171<sup>30</sup> , 201, 370– 373, 375, 376, 406, 410, 533 Projektionsstufe, 371, 375, 378, 410 proleptisch, 75, 280 Pronomen, 38,134,135<sup>20</sup> ,153,154,160, 210, 389, 390, 409<sup>15</sup> , 410–414, 420 Prädikat, 23, 23<sup>8</sup> , 28<sup>14</sup> , 40, 42, 45–48, 53<sup>23</sup> , 73, 74, 143<sup>22</sup> , 159, 207, 212, 286, 383, 392, 415 prädikativ, 39, 378 Präfix, 74, 280, 429, 430 Präposition, 69, 73, 81, 413 Präpositionalphrase, 69, 70, 73, 74, 411 Präsens, 22, 23, 23<sup>8</sup> , 193, 213, 286<sup>7</sup> , 382, 402, 419–421 Präteritum, 23,193, 213, 286<sup>7</sup> , 391, 419– 421 psychologisches Subjekt, 48 reines Diskursphänomen, 72, 74 rekursiv, 61<sup>30</sup> , 369, 370, 401, 509, 530 Relativmodus, 427–430 Relativphrase, 409<sup>15</sup> , 423, 426, 429, 430 Relativsatz, 94,100,102,104, 205, 287<sup>9</sup> , 407, 408<sup>14</sup> , 422, 424, 430 Rhema, 110, 179, 182–184, 184<sup>36</sup> Satzadverbialen, 94, 95, 98–100, 125,

214 Satzende, 40, 43, 48, 65, 182 Satzglied, 45, 289<sup>13</sup> Satztyp, 17, 63, 285, 391 satzwertig, 50<sup>22</sup> Schema, 21, 23, 26<sup>10</sup> , 28, 30, 30<sup>16</sup> , 31– 34, 36, 49, 53, 54, 62–64, 68, 78, 83, 202, 203, 425, 500 segmental,114, 406, 413, 415, 573, 582, 589, 592 SELR, 505, 510, 511, 532, 555, 556 Skopus, 291, 393<sup>5</sup> , 397, 398, 409<sup>15</sup> , 413<sup>18</sup> , 532 SLF, 193, 194, 203–206, 208–217, 299, 302<sup>3</sup> , 304–308, 309<sup>8</sup> , 378 SOV, 12, 17, 19 Spracherwerbsdaten, 29, 58, 59, 62, 65 Subject Condition, 503–506, 546, 549 Subjekt,17–21, 23, 23<sup>8</sup> , 24, 25, 27, 27<sup>11</sup> , 28, 28<sup>13</sup> , 28<sup>14</sup> , 29, 31–34, 37, 43–49, 51–53, 53<sup>23</sup> , 54, 62, 64, 65, 81<sup>37</sup> , 102, 120<sup>8</sup> , 143<sup>22</sup> , 147, 148, 170, 172<sup>31</sup> , 173, 174, 177, 178, 194, 202, 204, 205, 209, 211, 216, 217, 287, 288, 288<sup>11</sup> , 369, 373, 377, 378, 406, 417–419, 421–430, 504, 510, 511 Subjektinversion, 44–47, 48<sup>21</sup> Substantiv, 13, 23, 42, 96, 137, 150<sup>24</sup> , 382 SVO, 12, 17–19, 309<sup>8</sup> syntaktische Funktion, 9, 285 Tempus, 40, 101, 122, 193, 286<sup>7</sup> , 386, 419 Thetaraster, 375, 378 Tiefenstruktur, 182

Topik, 40, 42, 120, 120<sup>8</sup> , 120<sup>9</sup> , 127, 132, 133, 140, 141, 144, 148, 151, 155–157, 157<sup>27</sup> , 158–160, 170, 180, 181, 286 Topologie, 11, 48<sup>21</sup> , 105, 107, 108, 111, 169<sup>29</sup> , 171, 175, 285<sup>6</sup> topologisches Schema, 62, 63 transformationelle Grammatik, 182 unmarkiert, 141, 164, 165, 167 V1, 553, 566, 567 Verb, 15, 16, 16<sup>4</sup> , 18, 20, 23, 24, 27, 30, 32, 33, 36, 39, 40, 43– 50, 50<sup>22</sup> , 51, 62, 64, 65, 68, 75, 76, 81<sup>37</sup> , 84, 96, 101, 102, 102<sup>3</sup> ,103,126,126<sup>14</sup> ,133,138, 140, 147<sup>23</sup> , 149, 153, 154, 160, 169<sup>29</sup> , 177, 178, 185, 193, 194, 196, 203, 206, 222, 227, 283, 283<sup>3</sup> , 286, 288, 289, 289<sup>13</sup> , 290, 291, 370–373, 382, 384, 385, 389–394, 398, 401–406, 413<sup>18</sup> , 414, 417–420, 424, 425, 427– 430, 508, 521, 527, 535 Verberststellung, 391, 392, 417 Verbform, 75, 290, 386<sup>3</sup> , 417, 419, 421 Verbprojektion, 422, 424, 425, 508 Verbzusatz, 280, 382, 385, 402 Verbzweitstellung, 395, 402, 405, 408 Verum, xix, 338, 383, 384, 387–389, 391, 393–398, 398<sup>6</sup> , 399–404, 406–408, 408<sup>14</sup> , 409–413, 413<sup>17</sup> 414 vorangestelltes Verb, 419 VOS, 12, 16 VP, 261, 323, 376, 422, 423, 425, 429, 430, 494, 502, 503, 556, 559 VSO, 12, 17–19

,

280, 284, 370 Wortfolge, 10, 23, 23<sup>8</sup> , 39, 41<sup>19</sup> , 42, 46, 108, 146–148, 157, 161, 169<sup>29</sup> , 173 Wortgruppe, 20, 48, 285 Wortstellung, 11, 12, 14–17, 20, 21, 21<sup>7</sup> , 23, 26, 27, 30, 32, 47, 48, 108, 111,131,138,164–168,170,171, 171<sup>30</sup> , 174, 179, 181, 186, 214, 288, 288<sup>10</sup> , 419, 503 dominante,12–16,16<sup>4</sup> ,17–20, 21<sup>7</sup> , 24, 25, 27–29

, 263, 264, 26515b

,

VZ,193, 259–261, 26315a

# Did you like this book?

This book was brought to you for free

Please help us in providing free access to linguistic research worldwide. Visit http://www.langsci-press.org/donate to provide financial support or register as a community proofreader or typesetter at http://www.langsci-press.org/register.

## Beiträge zur deutschen Grammatik

Der vorliegende Band bietet eine vollständige Sammlung der veröffentlichten und unveröffentlichten Schriften zur deutschen Grammatik von Tilman N. Höhle. Sie besteht aus zwei Teilen. Den ersten Teil bildet *Topologische Felder*, ein im Jahr 1983 verfasstes Manuskript in Buchlänge, das jedoch nicht abgeschlossen wurde. *Topologische Felder* ist eine sorgfältige Untersuchung der topologischen Eigenschaften deutscher Sätze und schließt eine eingehende Diskussion typologischer Annahmen mit ein. Der zweite Teil umfasst alle weiteren veröffentlichten und unveröffentlichten Höhleschen Papiere zur deutschen Grammatik.

Alle hier versammelten Arbeiten hatten weitreichenden Einfluss auf die deutsche Sprachwissenschaft deskriptiver und theoretischer Prägung, insbesondere auf eine spezielle Ausprägung der theoretischen Sprachwissenschaft, die Head-Driven Phrase Structure Grammar. Die Arbeiten befassen sich mit den Themen Satzstruktur, Wortstellung, Koordination, (Verum-)Fokus, Wortstruktur, der Beziehung zwischen Relativpronomen und Verben in V2, Extraktion, sowie den Grundlagen einer phonologischen Theorie in constraintbasierter Grammatik.

This volume contains the complete collection of published and unpublished work on German grammar by Tilman N. Höhle. It consists of two parts. The first part is *Topologische Felder*, a book-length manuscript that was written in 1983 but was never finished nor published. It is a careful examination of the topological properties of German sentences, including a discussion of typological assumptions. The second part assembles all other published and unpublished papers by Höhle on German grammar.

All of these papers were highly influential in German linguistics, in theoretical linguistics in general, and in a specific variant of theoretical linguistics, Head-Driven Phrase Structure Grammar. Topics covered are clause structure, constituent order, coordination, (verum) focus, word structure, the relationship between relative pronouns and verbs in V2, extraction, and the foundations of a theory of phonology in constraint-based grammar.